sqoop从oracle数据库抽取数据,导入到hive
环境: hadoop-2.7.5 sqoop-1.4.7 zookeeper-3.4.10 hive-2.3.3 (使用mysql配置元数据库) jdk1.8.0_151 oracle 11.2.0.3.0 经过一番baidu,总算初步成功,现在记录一下中间过程. 1.拷贝hive/conf/hive_site.xml到sqoop/conf目录 ??? export HADOOP_COMMON_HOME=/home/hadoop/hadoop-2.7.5 3.拷贝hive/lib/derby-10.10.2.0.jar到sqoop/lib 8.修改/home/~/.bashrc,在最后增加? export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/* 执行 sqoop import --connect jdbc:oracle:thin:@10.0.3.3:1521:sid --username abc --password r123? --table CMX.SALES? -m 1 --hive-import --hive-overwrite --hive-database ra --hive-table "cmx_sales" --null-non-string ‘‘ --null-string ‘‘ --delete-target-dir --hive-drop-import-delims 该命令能够抽取oracle中cmx_sales表的数据到hive中,现在面临问题,hive中自动创建的表,字段类型与oracle的不一样,造成数据精度不一样. 比如oracle中字段为number(10),到hive中变为double,数据也从1000变成1000.0. 续待... (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |