笔趣阁

速阅阁>半年爆赚200亿美金陈浩 > 第1745章 一句话点醒了贾瀞雯(第1页)

第1745章 一句话点醒了贾瀞雯(第1页)

办公室里安静得能听见服务器风扇转动的声音。

李明盯着屏幕,右手放在鼠标上。

他点了一下,屏幕中央的小沙漏开始转。

一秒,两秒,三秒……十秒过去了。

屏幕终于刷新,显示出一列结果。

“还是慢。”他叹了口气。

贾瀞雯站在他身后,看着那些搜索结果。

李明刚才输入的是“电脑价格”,出来的结果有七八条,但只有两条真正和电脑价格有关。

一条是电脑公司的介绍,另一条是去年的旧新闻。

剩下的,有一条是“电影《电脑奇侠》”,还有几条是其他完全不相关的内容。

“准确率多少?”贾瀞雯问。

张涛在另一台电脑前算了一下“刚测了五十个关键词,只有十五个返回了有用结果。

准确率……百分之三十左右。”

会议室里一片沉默。

五个年轻人都在,脸上的表情都差不多——疲惫,还有点沮丧。

他们已经连续工作了两个月,做出了这个能跑起来的搜索引擎。

可效果实在不理想。

“度呢?”贾瀞雯又问。

“平均响应时间十二秒。”王磊说,“最慢的一次等了半分钟。

这还只是在我们内网测试,如果放到真实的网络上,有延迟,有带宽限制,可能更慢。”

贾瀞雯点点头。

她走到白板前,看着上面密密麻麻的架构图。

爬虫、索引、分词、排序……每个模块都做了,每个模块都能工作,可组合起来就是这个结果。

“问题出在哪儿?”她问。

李明站起来,走到白板前“先是索引结构。

我们现在用的是最简单的倒排索引,但数据量一大,查询效率就低。

需要优化数据结构。”

张涛补充“分词也有问题。

基于词典的方法太死板,很多新词、专业词切分不准。

比如‘奔腾处理器’,我们的词典里没有这个词,就切成‘奔腾’和‘处理器’,但用户可能搜‘奔腾处理器’整个词。”

“排名算法也不够聪明。”王磊说,“现在基本是按关键词出现次数排序,但这样很容易被垃圾页面钻空子。

一个页面堆满关键词,就能排到前面,可内容根本没价值。”

贾瀞雯听着,一条条记在本子上。

她知道这些技术问题,但她更知道另一个问题——时间。

钱花得比预期快。

已完结热门小说推荐

最新标签