|
职位描述:
1.使用网络爬虫等技术大批量抓取各大财经类网站的新闻及分析报告。
2.对所抓取或下载的文本进行格式(如pdf ,word, html, xml等)处理、内容提取等初步处理。
3.参与开发文本分类算法(涉及机器学习技术)
职位要求:
1. 重点大学信息技术相关专业,大三或大四保研,研究生,保证一周至少三天到岗,实习期至少两个月。
2. 熟悉java或python网络爬虫技术,有相关项目经验者优先。
3. 熟悉html,xml文件处理和文本内容提取者优先。
有意者请发送简历至 ygyang@saif.sjtu.edu.cn 标题请注明 专业 ,年级, 一周工作天数
|
|