数据库 – Spark:运行InputFormat作为单例
我正在尝试将一个键值数据库集成到Spark,并提出一些问题.
我是Spark初学者,读了很多,运行一些样本,但也没有 复杂. 场景: 我正在使用一个小的hdfs集群将传入的消息存储在数据库中. 问题: 数据库软件的接口是基于JNI,数据库本身就是 由于这个限制,读取和写入数据库必须走 (背景信息:数据库嵌入到进程中,它是基于文件的, 解决方案: 我在脑海里有几个想法如何解决这个问题,但我不知道他们是否工作 >也许有可能神奇地配置Spark只有一个我的实例 我最喜欢的解决方案是#1,紧随其后的是#2. 感谢任何评论和答案! 解决方法你是否想过排队(缓冲区),然后使用火花流排队并使用您的输出格式进行写入.(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |