【发布时间】:2016-11-08 07:27:17
【问题描述】:
我已经浏览了 stackoverflow 和互联网上的所有答案,但没有任何效果。所以我有这个单词列表的 rdd:
tweet_words=['tweet_text',
'RT',
'@ochocinco:',
'I',
'beat',
'them',
'all',
'for',
'10',
'straight',
'hours']
**What i have done till now:**
Df =sqlContext.createDataFrame(tweet_words,["tweet_text"])
and
tweet_words.toDF(['tweet_words'])
**ERROR**:
TypeError: Can not infer schema for type: <class 'str'>
【问题讨论】:
标签: pyspark