谷歌启动数据集搜索测试版与新功能

2020-02-06 17:15:07

经过一年多的测试,谷歌有限责任公司今天推出了其数据集搜索服务,摆脱了beta测试模式,具有新的功能,旨在使用户能够更快地查找信息。

数据集搜索是该公司专门为浏览科学和技术信息集合而设计的搜索引擎的一个版本。到目前为止,谷歌已经索引了近2500万个数据集,涵盖从火山活动到小狗的社会行为等主题。这些信息来自政府、大学和其他从事研究活动的组织。

在人工智能迅速普及的情况下,开源数据在技术景观中发挥着越来越重要的作用。人工智能越复杂,它需要更多的培训数据才能成为生产准备。一个门户,如数据集搜索,在那里,AI开发人员可以集中的方式搜索记录,有可能成为一个有价值的工具,为机器学习项目。

谷歌正在标记数据集搜索从beta推出的新功能,旨在使该服务更加有用。首先,该公司声称它已经“显著改善”了信息存储库描述的质量。还有一些新的过滤器允许用户根据他们需要什么样的数据集来缩小搜索结果。

谷歌研究科学家娜塔莎·诺伊(Natasha Noy)在一篇博客文章中写道:“你现在可以根据你想要的数据集类型(例如,表格、图像、文本),或者数据集是否可以免费从提供商那里获得过滤结果。“如果一个数据集是关于一个地理区域的,你可以看到地图。

最后,该服务现在可以在移动设备上访问。诺伊告诉《Verge》(The Verge),谷歌计划继续改进数据集搜索(Dataset Search),增加功能,让用户“在不一定知道自己在寻找什么的情况下”探索数据集。

人工智能开发人员远远不是唯一的知识工人可以利用他们的项目中的服务。全球有数十万人使用数据集搜索,包括学术研究人员、商业分析师和学生。

这项服务的基础工作早在2011年就已经打好了,当时谷歌(GoogleLLC),雅虎(Yahoo)!微软公司发起了一个名为Schema.org的联合开源项目。公司开始创建一个通用的标准来格式化网页,其中包含结构化数据,如研究文件。自那时起,Schema.org就被世界上大多数国家的政府以及众多的学术机构采用,而Dataset Search采用了标准来索引它为用户服务的记录。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。