加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据挖掘 – sharkscope或PTR数据究竟如何挖掘所有这些手?

发布时间:2020-12-14 04:15:48 所属栏目:大数据 来源:网络整理
导读:我很好奇知道这个过程是如何工作的.这些网站( http://www.sharkscope.com和 http://www.pokertableratings.com)每天可以从安全的扑克网络(如PokerStars和Full Tilt)中获得数千手数据. 他们有一个服务器场运行应用程序,打开数百个表(窗口),然后以某种方式蜘蛛
我很好奇知道这个过程是如何工作的.这些网站( http://www.sharkscope.com和 http://www.pokertableratings.com)每天可以从安全的扑克网络(如PokerStars和Full Tilt)中获得数千手数据.

他们有一个服务器场运行应用程序,打开数百个表(窗口),然后以某种方式蜘蛛/数据库正在播放的手?

这是如何工作的,编程智能?

解决方法

有几个选择.我一直在研究它,因为我想在我正在开发的一个Web应用程序中实现一些这样的功能.我将以PokerStars为例,因为他们目前是拥有任何在线扑克网站的最佳安全性.

首先,意识到开发人员没有办法从PokerStars应用程序本身撕下实时信息.您无法访问API.但是,您可以执行以下操作:

屏幕刮擦/ OCR

扑克之星尽力破坏其应用程序的屏幕/文字(通过执行像素级颜色波动等简单的内容),但是有足够的动力,您可以轻松解决这个问题. Google AutoHotkey与ImageSearch相结合.

API访问和XML Feed

扑克之星不提供公开访问其API.但它确实为预先批准的开发人员提供了XML Feed.此XML Feed提供:

扑克之星站点摘要 – 显示球员,桌面和比赛数量
> PokerStars扑克之星当前比赛数据 – 有关即将到来的积极比赛信息的文件.数据提供两个文件:

扑克之星静态锦标赛数据 – 提供不会频繁变化的锦标赛信息
> PokerStars动态比赛数据 – 提供频繁变化的锦标赛信息

扑克之星锦标赛结果 – 提供有关完成比赛的信息.数据提供两个文件:

扑克之星锦标赛结果 – 提供完成比赛的基本信息,
扑克之星锦标赛扩大成绩 – 提供有关完成锦标赛的扩展信息.

扑克之星锦标赛领袖董事会 – 提供有关扑克之星排名榜的扑克之星玩家信息
>扑克之星锦标赛领袖董事会BOP – 提供有关PokerStars扑克之星战列队排名系统的顶级扑克之星玩家的信息
>扑克之星队 – 提供有关扑克之星队员及其在线活动的信息

这些网站不太可能访问XML Feed(或者一个可以提供他们所需的所有功能的改进版),因为PokerStars与大多数这些网站不完全一致.

这有两个选择.刮网络连接的数据,我认为是不可能的边界(我没有经验,所以我不确定;我听说它是??高度加密,不容易修补,但我不知道),如上所述,屏幕刮除/ OCR.

选项#2容易实现,并且通过一些工作可以避免检测.从我能够收集到的东西,这是他们可以做这样大量的数据挖掘PokerStars的唯一方法(我没有看过其他网站,但除了PokerStars / Full Tilt之外,我听说过安全性还是相当可怕的).

[编辑]
重读你的问题,意识到我没有明确地回答.

是的,他们可能会有大量的服务器运行,观看所有当前正在运行的表,比赛等.意识到在他们正在做的事情中有一个相当的钱.

例如,这可能是他们如何做(猜测):

所述机器人应用程序观察表和数据挖掘所有被发布到聊天记录的信息.他们这样做已经有一张图像对应于例如字母表的所有字母表(因为PokerStars不会将他们的文本发布为…文本,他们的软件中的所有文本实际上都是一个图像).所以,机器人然后撕开聊天日志的图像,将其与商店匹配,将数据转换为可以使用的格式,并将其抛入数据库.完成.

[编辑]不,数据不是由扑克网站自己出售给他们的.这将是一个公共噩梦,如果它已经出来,它会的.而且这些网站的功能不会被视为瞬时的. OPR,Sharkscope等.毫无疑问,运行的应用程序是从扑克软件实时翻转数据,可能使用我列出的方法.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读