信息技术不断深入发展,使得海量的书籍、期刊以及学术文献都转存到网络数据库中,然而查阅问题也随之产生。与纸质实体不同,数据库中的书籍等资料分类查阅很难实现。因此,研究人员开发出一种可搜索的科学期刊数据库系统Bookworm-Arxiv。
该系统支持用户使用多个关键词进行搜索,然后返回以时间排序的内容分布曲线,为某些学术思想的起源和传播提供直观反映。更妙的是,因为知识库本身是免费和开放的,所以用户可以通过链接访问到各种自己感兴趣的文件。
同时纽约时报表示,系统开发团队曾与Google合作开发Ngram Viewer,为Google海量的扫描图书提供类似的搜索功能。但因版权问题,Ngram Viewer不能为读者提供更多的内容,限制了其整体使用效果。
Bookworm-Arxiv是为学术文献搜索而开发,给学术研究人员提供了便利。同时其思想与算法或许也能用于商业领域的信息搜索与分析,所以感兴趣的朋友可以仔细研究一下。
文章来自36氪