x 乔恩立刻点了点头:“好的boss我这就去吩咐!”
技术总监得到命令后也非常的小心谨慎。
上次的转链接事件让他在业内也被笑掉了大牙。
这次绝对不能再出任何纰漏了!
大约上午10点乐掏开启了第二次对掏宝页面的数据采集。
这次采集速度特别的慢为的就是防止陈默这边察觉。
然而贝索斯这边不知道的是陈默回到公司之后直接就让马福报开启了加水印logo功能。
这个功能所采用的技术手段并不是给服务器上所有的图片都加上水印而是直接在代码里增加一个功能——任何访问网站的用户甭管你是谁只要采集我的产品详情页数据一律把你能采集到的图片加上水印logo!
所以乐掏花了半个月改爬虫脚本又小心翼翼刻意放缓几十倍的速度进行数据采集陈默却大大方方去掉了冗余的反作弊代码仅仅只弄了个加水印logo的功能。
当乐掏的爬虫脚本工作的正起劲时乔恩过来询问:“这次没有脏数据了吧?”
技术总监自信满满道:“没了!刚刚一个小时采集的数据我让人反复测试了几十次一条转链接都没有!”
乔恩松了口气:“那就好让所有人都保持警惕!在采集数据的这几天时间里千万不能松懈!如果发现对方进行了反作弊代码及时修改脚本绝对不允许再出现脏数据了!”
“好!”
技术总监得到命令后主动继续进行数据监测并亲自充当qa跑了一整套的qa流程。
万幸没有出现任何的问题。
接着他就继续去重点监督采集的数量以及速度。
然而在不经意间技术总监点开了一个乐掏页面却赫然发现了不对劲!
怎么采集到的商品页面信息里所有的图片全都多了一个两行的半透明logo?!
logo的第一行写的是:掏宝网。
第二行写的是掏宝的网址。
这一瞬间技术总监如坠冰窟一般原本还激动高昂的情绪瞬间跌入了谷底!
“所有技术人员全给我检查你们手里采集到的数据看看商品页面上的图片有没有出现掏宝的logo!”
技术总监群发了消息。
然后很快在群里得到了反馈:
“报告我这边发现了!”
“报告总监我这边也有!”
“总监我们这边所有人手里的数据全有掏宝logo!”
技术总监知道大事不妙刚刚点燃的烟被他生生用手指给掐灭然后赶紧带着笔记本去找到了乔恩汇报。
乔恩紧绷了一天的神经在得到了技术总监的好消息后本来终于能得到一丝放松了。
他就等着几天后所有正常数据采集成功的好消息了。
结果技术总监这个时候抱着笔记本冲进了他的办公室。