- CC++。高效率快速,适合通用搜索引擎做全网爬取缺点,开发慢写起来又臭又长,例如:天网搜索源代码
- 脚本语言:Perl, Python, Java, Ruby。简单易学,良好的文本处理能方便网页内嫆的细致提取但效率往往不高,适合对少量网站的聚焦爬取
- C#(貌似信息管理的人比较喜欢的语言)
- 跨平台,对Linux和windows都有不错的支持
- 科學计算,数值拟合:NumpyScipy
- 统计:与R语言接口:Rpy
- CC++。高效率快速,适合通用搜索引擎做全网爬取缺点,开发慢写起来又臭又长,例如:天网搜索源代码
- 脚本语言:Perl, Python, Java, Ruby。简单易学,良好的文本处理能方便网页内嫆的细致提取但效率往往不高,适合对少量网站的聚焦爬取
- C#(貌似信息管理的人比较喜欢的语言)
- 跨平台,对Linux和windows都有不错的支持
- 科學计算,数值拟合:NumpyScipy
- 统计:与R语言接口:Rpy
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。