职位描述:
1、负责设计和开发分布式网络爬虫系统,进行数据抓取和分析;
2、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
3、参与分布式爬虫和数据采集系统的架构设计和开发,快速响应业务变动;
4、负责网络数据抓取规划、定期爬取指定网站的数据;
5、参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析;
6、实现数据提取、清洗、结构化、入库、统计分析等需求;
7、研究优化算法,提升爬虫系统的稳定性、可扩展性。
任职要求:
1、本科及以上学历,5年以上爬虫抓取采集相关工作经验,爬虫基础扎实;
2、熟练Python和常用的开源库,熟练使用Django/Flask等至少一种主流的web开发框架;
3、熟练Mysql,MongoDB, Redis,Es,队列等数据库的使用和优化;
4、对进程、线程、协程、异步、非阻塞有一定了解和使用;
5、熟练掌握爬虫主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一种);
6、熟悉应用IP代理池、Headers认证和Cookie等;
7、熟悉分布式爬虫,JS防护、混淆、逆向分析等技能,熟悉各种浏览器检测/反检测手段;
8、熟悉Python/Java/Go/C++其中一种语言,具备扎实的编码能力;
9、责任心强、工作积极、良好的服务意识、较强的工作适应能力,自我驱动;
10、加分项:逆向、分布式、数据分析、数据挖掘;有训练过自己的模型;github或者码云有相关开源项目;有海量代理池搭建经验;有采集政府网址经验优先考虑;
1、负责设计和开发分布式网络爬虫系统,进行数据抓取和分析;
2、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
3、参与分布式爬虫和数据采集系统的架构设计和开发,快速响应业务变动;
4、负责网络数据抓取规划、定期爬取指定网站的数据;
5、参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析;
6、实现数据提取、清洗、结构化、入库、统计分析等需求;
7、研究优化算法,提升爬虫系统的稳定性、可扩展性。
任职要求:
1、本科及以上学历,5年以上爬虫抓取采集相关工作经验,爬虫基础扎实;
2、熟练Python和常用的开源库,熟练使用Django/Flask等至少一种主流的web开发框架;
3、熟练Mysql,MongoDB, Redis,Es,队列等数据库的使用和优化;
4、对进程、线程、协程、异步、非阻塞有一定了解和使用;
5、熟练掌握爬虫主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一种);
6、熟悉应用IP代理池、Headers认证和Cookie等;
7、熟悉分布式爬虫,JS防护、混淆、逆向分析等技能,熟悉各种浏览器检测/反检测手段;
8、熟悉Python/Java/Go/C++其中一种语言,具备扎实的编码能力;
9、责任心强、工作积极、良好的服务意识、较强的工作适应能力,自我驱动;
10、加分项:逆向、分布式、数据分析、数据挖掘;有训练过自己的模型;github或者码云有相关开源项目;有海量代理池搭建经验;有采集政府网址经验优先考虑;
职位类别: 软件工程师
举报
全选
申请职位
-
5K/月申请职位1、本科以上学历,计算机和软件相关专业 2、加分项:熟悉Python或Java语言,了解逆向、分布式、大数据分析、数据挖掘;有训练过自己的模型;github或者码云有相关开源项目;有海量代理池搭建经验
-
15-25K/月申请职位岗位要求: 1.对爬虫、图形验证码识别等技术有较深入研究 2. 计算机或相关专业专科以上学历,3年以上爬虫工作经验 3. 掌握网络爬虫开发原理,对互联网各种类型数据交互模式数据,知道如何处理需登..
-
8-10/月申请职位岗位职责:1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;2、负责网页信息抽取、数据清洗等研发和优化工作;。任职资格:1、具有1年以上爬虫相关经验,熟悉验证码破解,动态IP..
-
面议申请职位1、本科以上学历,计算机和软件相关专业2、加分项:熟悉Python或Java语言,了解逆向、分布式、大数据分析、数据挖掘;有训练过自己的模型;github或者码云有相关开源项目;有海量代理池搭建经验。
-
8-12K/月申请职位1.负责爬虫软件工具和爬虫技术的选取; 2.负责爬虫采集器设计、开发、优化; 3.实现各种互联网来源的数据标准化处理入库。 任职要求 1.本科及以上学历,能力优秀者可放宽到大专学历;..
-
8-12K/月申请职位职位描述: 1、互联网站,网页,链接的特征挖掘 ,对指定的多个网站的网页进行网页抓取、数据的提取、清洗、入库; 2、对搜索、匹配、同步等后台守护程序进行性能优化等; 3、负责系统日常运营资源..
-
1-2/月申请职位★美至的使命: 用数据赋能零售和连锁服务行业的增长与变革。★我们的团队: 我们的创始人是资深的风险投资人,聚焦美妆、零售、连锁服务及科技领域; 我们的团队具有丰富的跨行业经验:顶尖互联..
-
面议申请职位1、设计和开发分布式网络爬虫系统,进行多平台信息抓取和分析工作。2、负责完成网站数据采集爬取、解析提取、清洗入库等数据生产工作。3、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量。4、..
- 公司规模:100 - 499人
- 公司性质:民营企业
- 所属行业:网络产品开发
- 所在地区:
- 联系人:姜女士
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:
工作地址
- 地址:






