加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

【疑问回答】R语言如何做文本挖掘?R语言拟合??

发布时间:2020-12-14 02:10:52 所属栏目:大数据 来源:网络整理
导读:问题一:R语言如何做文本挖掘? 回答: 关于R语言做文本挖掘,可以参阅以下资料。 1 R语言环境下文本挖掘【http://www.bjt.name/2012/03/text-mining-in-r/】,作者编写的一份R语言文本挖掘的手册很值得阅读和实践。 2 R语言tm工具包进行文本挖掘实验【http:

问题一:R语言如何做文本挖掘?

回答:关于R语言做文本挖掘,可以参阅以下资料。

1 R语言环境下文本挖掘【http://www.bjt.name/2012/03/text-mining-in-r/】,作者编写的一份R语言文本挖掘的手册很值得阅读和实践。

2 R语言tm工具包进行文本挖掘实验【http://blog.csdn.net/bentley2010/article/details/7753026】

3 R语言文本挖掘公开课【http://www.analyticsvidhya.com/resource-text-mining/】

4 R语言文本挖掘4个技巧【http://www.analyticsvidhya.com/blog/2015/09/learn-top-4-hacks-perform-text-mining-faster/】


问题二:R语言拟合?

回答:

曲线拟合:(线性回归方法:lm)

1、x排序

2、求线性回归方程并赋予一个新变量

z=lm(y~x+I(x^2)+...)

3、plot(x,y) #做y对x的散点图

4、lines(x,fitted(z)) #添加拟合值对x的散点图并连线

曲线拟合:(nls)

lm是将曲线直线化再做回归,nls是直接拟合曲线。

需要三个条件:曲线方程、数据位置、系数的估计值。

如果曲线方程比较复杂,可以先命名一个自定义函数。

例:

f=function(x1,x2,a,b) {a+x1+x2^b};

result=nls(x$y~f(x$x1,x$x2,b),data=x,start=list(a=1,b=2));

#x可以是数据框或列表,但不能是矩阵

#对系数的估计要尽量接近真实值,如果相差太远会报错:“奇异梯度”

summary(result); #结果包含对系数的估计和p值

根据估计的系数直接在散点图上使用lines加曲线即可。

曲线拟合:(局部回归)

lowess(x,y=NULL,f = 2/3,iter = 3)

#可以只包含x,也可使用x、y两个变量

#f为窗宽参数,越大越平滑

#iter为迭代次数,越大计算越慢

loess(y~x,data,span=0.75,degree=2)

#data为包含x、y的数据集;span为窗宽参数

#degree默认为二次回归

#该方法计算1000个数据点约占10M内存

举例:

x=seq(0,10,0.1); y=sin(x)+rnorm(101) #x的值必须排序

plot(x,y); #做散点图

lines(lowess(x,y)); #利用lowess做回归曲线

lines(x,predict(loess(y~x))); #利用loess做回归曲线,predict是取回归预测值

z=loess(y~x); lines(x,z$fit); #利用loess做回归曲线的另一种做法

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读