加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

以Ruby可以理解的格式获取Wikipedia信息框

发布时间:2020-12-17 03:52:04 所属栏目:百科 来源:网络整理
导读:我试图将维基百科的信息框中的数据转换为哈希或其他东西,以便我可以在我的 Ruby on Rails程序中使用它.具体来说,我对 Infobox company和 Infobox person感兴趣.我一直使用的例子是“福特汽车公司”.我希望得到公司的信息以及与福特公司方框相关联的人员的人
我试图将维基百科的信息框中的数据转换为哈希或其他东西,以便我可以在我的 Ruby on Rails程序中使用它.具体来说,我对 Infobox company和 Infobox person感兴趣.我一直使用的例子是“福特汽车公司”.我希望得到公司的信息以及与福特公司方框相关联的人员的人员信息.

我已经尝试从Wikipedia API或DBPedia找出如何做到这一点,但我运气不好.我知道维基百科可以将一些东西作为json返回,我可以用ruby解析但是我无法弄清楚如何获取信息框.在DBPedia的情况下,我有点迷失在如何查询它以获取福特汽车公司的信息.

解决方法

我投票支持DBpedia.

一个简单的解释是:

dbpedia命名方案是http://dbpedia.org/resource/WikipediaArticleName(唯一标识符),空格由_替换.

http://dbpedia.org/page/ArticleName(html预览)和http://dbpedia.org/data/ArticleName(.json/.jsod)是有关所需文章信息的JSON表示. (.rdf等可能会让你感到困惑.)

对于福特汽车公司,您应该要求:

http://dbpedia.org/data/Ford_Motor_Company.json

要么:

http://dbpedia.org/data/Ford_Motor_Company.jsod

(以较简单的方式)

现在,根据文章类型,个人或公司,有不同的属性定义它们依赖于dbpedia本体(http://wiki.dbpedia.org/Ontology).

更高级的步骤可能是使用SPARQL查询来获取数据.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读