我是标题
  • 介绍
  • 产品使用指南
    • 新手入门
      • 神策分析是什么
      • 神策分析能做什么
      • 神策分析怎么解决问题
      • 神策分析的数据来源
    • 功能介绍
      • 基本概念
        • 行为分析常用名词
        • 神策分析相关名词
        • 基础指标配置说明
        • 属性筛选条件说明
      • 分析模块
        • 事件分析
        • Session 分析
        • 漏斗分析
        • 留存分析
        • 分布分析
        • 归因分析
        • 用户路径分析
        • 网页热力分析
        • APP 点击分析
        • 间隔分析
        • 用户属性分析
        • 搜索用户
        • 用户分群
          • 用户分群(1.14 版本)
          • 用户分群
          • 用户分群(1.13 之前版本)
        • 用户行为序列
        • 书签及数据概览
          • 数据概览(1.11 之前版本)
          • 概览分组
          • 渠道对比组件使用说明
          • 预置概览
        • 自定义查询
      • 辅助功能
        • 事件分类
        • 查询抽样
        • 权限管理
          • 角色权限与账号(1.14 版本)
        • 预警管理
        • 元数据管理
        • 可视化全埋点
        • 维度字典
        • 正则表达式
        • 推荐分享
        • 小版本升级
        • 掌上神策分析
  • 技术指南
    • 数据采集
      • 数据模型
      • 数据格式
      • 调试模式
        • 调试模式动态配置
      • 数据校验
      • 导入实时查看
        • 导入实时查看(新版本)
        • 导入实时查看(老版本)
      • 埋点管理
      • 多项目
      • 如何准确的标识用户
      • 新增用户及首日首次标记
    • 快速接入指南
      • 接入前准备(全员阅读)
      • 如何准确的标识用户 (全员阅读)
      • 事件设计 (需求方阅读)
      • SDK 采集数据 (开发必读)
        • JavaScript 快速使用
        • 微信小程序快速使用
        • Android 快速使用
        • iOS 快速使用
        • Java 快速使用
      • 数据校验(测试必读)
    • 客户端 SDK
      • C++ SDK
      • 微信小程序 SDK
        • 微信小程序 SDK 历史版
        • 微信小程序 SDK 标准版
        • 微信小程序 SDK 插件版
        • 微信小程序 SDK 自定义全埋点版
      • 支付宝小程序 SDK
      • 百度小程序 SDK
      • JavaScript SDK
        • 常见问题
        • 全埋点(AutoTrack)
        • 点击图(HeatMap)
        • 单页面
        • 关闭页面发数据
      • Android SDK
        • 常见问题
        • 全埋点(AutoTrack)
        • 点击图(HeatMap)
      • iOS SDK
        • 常见问题
        • 全埋点(AutoTrack)
        • 点击图(HeatMap)
      • 打通 App 与 H5
      • App 第三方框架
        • React Native(Android & iOS)
        • Flutter(Android & iOS)
        • Weex(iOS)
        • Weex(Android)
        • 第三方 H5 页面嵌入 js(iOS)
        • 第三方 H5 页面嵌入 js(Android)
      • APICloud SDK
    • 服务端 SDK
      • C SDK
        • C SDK Demo
      • CSharp SDK
      • Java SDK
        • Java SDK Demo
      • Python SDK
      • PHP SDK
      • Ruby SDK
      • Golang SDK
      • Node SDK
    • 公共属性
    • 渠道追踪
      • App 渠道追踪
      • Web 渠道追踪
      • 小程序渠道追踪
      • 渠道对接
      • 渠道链接管理
    • 数据导入
      • BatchImporter
      • LogAgent
        • LogAgent 场景使用示例
      • FormatImporter
      • HdfsImporter
      • 数据导入常见问题
    • 数据导出
      • 查询 API
      • 订阅实时数据
      • 使用 JDBC 进行数据访问
      • 数据迁移
    • 辅助工具
      • 数据清理工具使用说明
      • 多项目管理工具使用说明
      • 元数据创建工具使用说明
      • 环境检测工具使用说明
    • 高级功能
      • 数据接入 API
      • App 消息推送
      • 虚拟属性和维度表
      • 数据预处理模块
      • 服务转发配置
      • 使用 HTTPS 的数据接入
      • API
        • 查询 API
        • 功能 API
          • 分群 API(1.12 及之前版本)
          • 分群 API(1.13 版本)
          • 分群 API(1.14 版本)
          • 埋点统计 API(1.11 及之前版本)
          • 埋点统计 API(1.12 及之后版本)
      • 第三方登录
      • 数据归档
  • 最佳实践
    • 功能应用示例
      • 事件分析
      • 漏斗分析
      • 留存分析
      • 分布分析
      • 间隔分析
      • 用户分群
      • 自定义查询
      • 用户行为序列
    • 复杂分析场景
      • 定位商品销量变化原因
  • 常见问题
  • 产品更新日志
Powered by GitBook
On this page
  • 1. 数据类型不一致
  • 2. 批量导入多次使用相同目录
  • 3. 实时数据无法正常导入
  • 4. 数据中包含 COOKIE 字段但前端没有显示
  • 5. 某个 property 在前端看不到
  • 6. LogAgent 无法导入数据
  • 7. 怎样统计前端的点击和展示?
  • 8. 如何清除某个事件?
  • 9. 如何清理某个时间段导入的数据?
  • 10. 修改某个字段的数据类型:
  • 11. 如何区分系统固有属性和自定义属性?
  • 12. track_signup 的作用是什么?
  • 13. 数据导入 Token 的作用是什么?
  • 13.1 判断 Token 类型
  • 13.2 取数据 Token
  • 13.3 设置 Token
  • 14. 使用sdk导入在埋点管理发现报错,如何找回错误的数据?

Was this helpful?

  1. 技术指南
  2. 数据导入

数据导入常见问题

PreviousHdfsImporterNext数据导出

Last updated 6 years ago

Was this helpful?

1. 数据类型不一致

如 Age 属性最先是 数值(如:12),之后使用了 字符串(如:"12",注意多了双引号)。某个属性的类型确定后(由该属性首次出现时的类型决定)不能改变.

2. 批量导入多次使用相同目录

建议每次批量导入都使用不同目录,方便出现问题后重新导入.

3. 实时数据无法正常导入

  1. 请检查 SDK 或 LogAgent 发送数据目标机器是否填写正确,注意端口号和 sa,一般是:http://sa_host:8006/sa

  2. 请检查数据是否符合

4. 数据中包含 COOKIE 字段但前端没有显示

字符串的属性最长为 255 字节,超过会被忽略。类似 COOKIE 的字段建议做 ETL 转化为 用户 ID 等.

5. 某个 property 在前端看不到

可能的原因:

  1. 类型不符:使用了与之前不同的数据类型

  2. 数据过长:如字符串最长 255 字节。

  3. 非有效类型:使用了 中未定义的数据类型,比如某个 property 是一个 JSON object。若如此,请将此对 JSON object 内含字段单独抽取出来作为 property 使用

  4. 非固有字段加了$:只有 中定义的固有字段的 key 可以以$开头

6. LogAgent 无法导入数据

一般由 LogAgent 日志可以定位问题。

  1. 请检查接收数据的 URL

7. 怎样统计前端的点击和展示?

8. 如何清除某个事件?

0.1 不支持数据的删除。请使用 “事件管理” 的 “隐藏” 功能(0.2支持)将不需要的事件隐藏,然后使用新的事件名导入.

9. 如何清理某个时间段导入的数据?

暂时不支持该功能.

10. 修改某个字段的数据类型:

某个属性的数据第一次出现后会确定该属性的类型,之后不能改变.

11. 如何区分系统固有属性和自定义属性?

只有系统固有属性使用 $ 前缀,其余均为自定义属性.

12. track_signup 的作用是什么?

  • track_signup 的用途是关联新旧 id,当且仅当此时 original_id 为必须字段且有意义.

  • distinct_id 为必须字段,没有该字段会被认为是无效数据.

13. 数据导入 Token 的作用是什么?

自 Sensors Analytics 1.6 开始,我们增加了数据导入 Token。现在有两种类型的 Token:

  1. Normal Token:使用该 Token 可以导入已经存在的事件(仅可包含已经存在的属性)和用户属性数据,若事件不存在或事件或用户的某个属性未在 Sensors Analytics 里建立,那么这条数据将被抛弃;

  2. Super Token:用该 Token 除了可以导入数据,还可以在 Sensors Analytics 创建不存在的事件和属性;

其他:

  • 云版不支持自定义数据导入 Token;

  • 默认情况下 Normal Token 和 Super Token 值为空;

  • 不同项目可以设置不同的 Token;

13.1 判断 Token 类型

判断一条数据使用哪一种 Token 将采取如下流程:

  1. 初始化,标记数据为 无效数据;

  2. 将数据的 Token 与 Normal Token 比较,若值相同或 Normal Token 值为空,那么标记数据为 Normal 数据;

  3. 将数据的 Token 与 Super Token 比较,若值相同或 Super Token 值为空,那么标记数据为 Super 数据;

从上到下经过这 3 步流程,即一条数据将尝试获取能取到的最大的权限,若最终仍然是“无效数据”,那么这条数据将被抛弃。

举例如下:

  • Super 数据: 可根据数据创建事件、属性等;

  • Normal 数据: 可导入但不能创建事件、属性等。若数据中包含不存在的事件、属性,数据将被抛弃;

  • 无效数据: 抛弃这条数据;

Super Token

Normal Token

数据 Token

类型原因

数据类型

(空)

(空)

(空)

第三步中“Super Token 值为空”

Super 数据

(空)

(空)

ABC

第三步中“Super Token 值为空”

Super 数据

(空)

123

(空)

第三步中“Super Token 值为空”

Super 数据

(空)

123

ABC

第三步中“Super Token 值为空”

Super 数据

(空)

123

123

第三步中“Super Token 值为空”

Super 数据

XYZ

(空)

(空)

第二步中“Normal Token 值为空”

Normal 数据

XYZ

(空)

ABC

第二步中“Normal Token 值为空”

Normal 数据

XYZ

(空)

XYZ

第三步中“与 Super Token 值相同”

Super 数据

XYZ

123

(空)

第一步中标为无效数据

无效数据

XYZ

123

ABC

第一步中标为无效数据

无效数据

XYZ

123

123

第二步中“Normal Token 值为空”

Normal 数据

XYZ

123

XYZ

第三步中“与 Super Token 值相同”

Super 数据

13.2 取数据 Token

数据的 Token 获取流程如下:

  1. 取数据中的 'token' 字段(与 'type' 字段平级),如:

     {"distinct_id":"a","time":1471586368135,"type":"track","event":"ViewProduct","properties":{},"token":"my_token"}
  2. 若上一步没有取到,取数据接入地址中的 token 值,如:

     http://SA:8006/sa?token=my_token
  3. 若仍然没有取到,那么认为值为空。

13.3 设置 Token

14. 使用sdk导入在埋点管理发现报错,如何找回错误的数据?

我们在系统的日志目录下保留了一段时间的错误日志,需要登录到机器上查看,具体方法是:

  1. 登录到机器上。切换到 sa_cluster 帐号,注意集群版需要登录每台机器才能获取全部错误数据。云版目前不支持登录后台机器,需要联系我们来操作。

  2. 获取日志目录。执行 grep 'sensors_analytics.log_dir' ~/sa/conf/sensors_analytics.property 查看结果。

  3. 进入上面的目录,然后cd extractor,会发现有一系列invalid_records开头的文件,即为错误日志保留的文件。

注意:

  1. 错误日志只会保留一段时间,默认是 14 天,但是如果磁盘报警可能会清理部分日志。

  2. 错误日志文件包含了所有项目的所有错误,请自行解析选择需要的日志。

LogAgent 读取的数据为每行一个 JSON,需要符合

使用 ,在前端的 点击/展示 行为发生时调用 SDK 的 track 方法即可.

通过 设置 Normal Token 和 Super Token。

数据格式
数据格式
数据格式
数据格式
Javascript SDK
多项目管理工具