存量数据可通过数据采集应用导入系统。
目前支持从Hdfs导入保存在画像应用的hadooop集群上,将用户行为日志根据上报数据格式准备好后,通过简单几个步骤,即可将数据导入系统。
导入步骤:
1、配置数据源
输出数据源为画像应用的hadoop集群地址,地址固定为:hdfs://node1, 端口为8020,见下图
输入数据源同样根据上图配置,地址端口填写自己集群信息即可
2、任务构建
配置读插件,数据源选择输入数据源,如下图:
配置输出,注意文件路径只能配置为/log/项目名,项目名需要创建项目时指定,只有成功创建项目后,才能成功执行任务
3、执行任务
在任务管理里找到创建的任务,通过操作执行一次导入数据,任务是否成功可通过日志管理查看
作者:huachun.lei 创建时间:2022-05-30 14:31
最后编辑:huachun.lei 更新时间:2022-05-31 14:29
最后编辑:huachun.lei 更新时间:2022-05-31 14:29