科百科
当前位置: 首页 范文大全

电商平台数据分析工具有哪些(电商平台的行为数据分析平台附源码)

时间:2023-05-21 作者: 小编 阅读量: 6 栏目名: 范文大全

基于此强需求开发小象用户行为分析,兼容神策开源的埋点SDK完成终端行为上报,采用NginxFlumekafka实现日志收集,采用Flink写入HDFS。后续计划增加友盟和其他SDK厂商的埋点处理,以及业务系统日志的采集入库。服务端API由数据接入系统组成,采用Nginx来接收通过API发送的数据,并且将之写到日志文件上。使用Nginx主要是考虑到其高并发、高可靠性与高可扩展性。用户行为采集场景通过应用场景梳理,实现以场景规划埋点,用场景检验埋点。

项目介绍:

大数据技术已经迅速应用于商业并产生价值,通过数据分析来识别用户行为,建立以用户为中心的低成本快速增长,是一个企业必须具备的核心竞争力。 随着成本的大幅度增加,企业必须改变过去粗放型的营销和运营方式,特别是在市场营销、产品制造、销售以及未来的客户服务等各个方面向更加科学、高效的方向转变。

电商系统上线后,需要收集用户行为数据,通过大数据实时分析实现电商业务数字化运营。基于此强需求开发小象用户行为分析,兼容神策开源的埋点SDK完成终端行为上报,采用Nginx Flume kafka实现日志收集,采用Flink写入HDFS。

本开源项目内容包括nginx环境配置、Flume解密和日志格式处理、将明文数据存放到kafka的Topic下、Flink消费后将埋点数据存入HDFS的关键4步操作。为方便前期埋点的校验调优,在kafka环节,增加了埋点解析数据JSON格式存入MySQL。后续计划增加友盟和其他SDK厂商的埋点处理,以及业务系统日志的采集入库。

工程流程

完成数据采集技术构建和业务设计,在App、小程序的系统供应商配合下完成用户行为数据采集埋点,并基于埋点的数据构建线上用户行为标签和画像。

项目主要内容
  • 日志采集(Flume kafka)
  • 日志入库(Flink HDFS)
  • 设计思路

架构设计思路

所谓“埋点”,是数据采集领域(尤其是用户行为数据采集领域)的术语,指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。比如用户某个icon点击次数、观看某个视频的时长等等。

业务设计思路

埋点业务设计,首先需要根据业务分析明确采集的目标行为,进一步搞清楚应该在哪些地方埋什么样的点。过程中建议使用“事件模型( Event 模型)”来描述用户的各种行为,事件模型包括事件( Event )和用户( User )两个核心实体。 基于4W1H模型描述用户行为可将整个行为描述清楚,要点包括:是谁、什么时间、什么地点、以什么方式、干了什么。通过这两个实体结合在一起就可以清晰地描述清楚用户行为。

技术架构

SDK埋点采集行为数据来源终端包括iOS、安卓、Web、H5、微信小程序等。不同终端SDK采用对应平台和主流语言的SDK,埋点采集到的数据通过JSON数据以HTTP POST方式提交到服务端API。 服务端API由数据接入系统组成,采用Nginx来接收通过 API 发送的数据,并且将之写到日志文件上。使用Nginx实现高可靠性与高可扩展性。 对于Nginx打印到文件的日志,会由Flume的 Source 模块来实时读取Nginx日志,并由Channel模块进行数据处理,最终通过Sink模块将处理结果发布到 Kafka中。

软件完整架构第三方埋点SDK集成步骤
  • 引入SDK:在终端应用配置文件添加 SDK 依赖,不同终端引入方式会有差异,具体操作步骤将在后续SDK技术文档中体现。
  • 配置上报服务端API地址:用于设置SDK上报API的服务端地址。
  • 开启全埋点:SDK 可以自动采集一些用户行为,如 App 启动、退出、浏览页面、控件点击。初始化 SDK 时,通过SDK提供的初始化方法可以配置开启全埋点。
API接入服务设计

不同渠道的埋点数据通过 HTTP API 发送给服务端API实现数据接入。 采用Nginx作为WEB容器接收客户端SDK发送的数据,并且将之写到日志文件上。使用 Nginx 主要是考虑到其高并发、高可靠性与高可扩展性。

用户行为采集场景

通过应用场景梳理,实现以场景规划埋点,用场景检验埋点。场景梳理可以抽象为三个层面:

  • 通用基础场景:共性操作统一考虑
  • 重要操作场景:重要操作整体归因
  • 业务主流程场景:以业务线定义完整过程
应用效果

想要源码,记得关注 转发 私信,私信回复【数据分析平台

    推荐阅读
  • 鸡肉焯水要多久(鸡肉焯水要多久时间)

    鸡肉焯水要十分钟左右主要看火候大小,如果火比较大可适当减少时间,一般不低于五分钟在炖鸡时,可放姜片、白醋、生抽等除去异味,我来为大家讲解一下关于鸡肉焯水要多久?跟着小编一起来看一看吧!在炖鸡时,可放姜片、白醋、生抽等除去异味。特别需要注意的是,一定要等水开了,再把鸡放进锅内,不要把鸡放进凉水内,这样鸡肉很容易老。

  • 东方不败各种技能(东方不败的日月神教有多可怕)

    相信看过《笑傲江湖》的观众对于日月神教都不陌生,日月神教可以说是最具有笑傲色彩的教派了。加上其教主东方不败天下第一的实力,日出东方为我不败名号震惊整个江湖。名门正派们也想对日月神教下手,但是碍于东方不败天下第一的实力,对于日月神教可谓是一点办法没有。足以可见江湖其他门派对于日月神教的又惧又恨。可以说是目前的最强刺客。

  • 仙剑奇侠传迷宫怎么走(仙剑奇侠传1迷宫地图攻略)

    反而错过了最值得研究的合体技能和尸块。隐龙窟的迷宫中没有什么好东西,因此不要抱什么希望可以在这里捞点好处。锁妖塔从将军墓出来之后,本来以为可以轻松一下了,谁知道下一个场景又是九阴山。在历代版本中只要有锁妖塔,都会将人绕晕。从进入锁妖塔那一刻开始,玩家就会陷入无尽的“痛苦”之中。锁妖塔底部的铁链更是让人崩溃。而有的机关则是混淆视听,用来得到某个无用道具。看来这都是仙剑早年给我们留下的精神财富啊!

  • mood翻译成中文(记住千万不要把blue)

    今天和战友分享一个短语bluemood按字面意思理解就是“蓝色心情”千万不要这样理解,blue除了表示蓝色外,还有忧郁的意思。所以很简单bluemood可以解释为闷闷不乐。跟bluemood意思相近的短语inabadmood也表示心情不好闷闷不乐,学会这个短语战友如果心情不好的时候,要试着去找些自己的爱好释放自己的情绪。

  • 阿里云acp 宣传图(引领跨屏营销革命)

    阿里云acp宣传图新华网上海7月9日电据高盛最新互联网营销趋势分析,SMAC将成为新一代互联网营销革命的核心,也将成为降低企业管理成本,提高企业竞争力的利器。云联网络是国内首家跨屏联动视频广告平台,可实现跨网络、跨终端、跨屏幕、跨媒体广告投放及数据计算。高盛指出,预计到2017年,全球70%的人口将用上智能手机。根据行业报告显示,全球2000强企业IT服务及外包预算支出将有15%用于SMAC。

  • 眼药水可以泡隐形眼镜吗

    而且佩戴过的隐形眼镜上会有蛋白质和脂质沉淀物,使用眼药水浸泡并不能去除这些物质,对隐形眼镜也是一种伤害。眼药水和护理液的成分不一样,一般的眼药水中都含有一定量的防腐剂,它会硬化隐形眼镜的镜片,戴了用眼药水泡的隐形眼镜后,角膜也会受到伤害。眼药水虽然具有消毒的作用,但它并不能去除隐形眼镜中的蛋白质,而除蛋白对于护理隐形眼镜来说是非常重要的。

  • 撩对象很甜的情话(撩对象的30句情话)

    就算不结婚也会在坟墓前分手。在这个感情泛滥的年度里,我只说,我喜欢你。你的身旁永远有个我,一直到夕阳下相互搀扶回家。

  • 难倒一亿人的题(世界上最难的数学题)

    这样的数称为素数;它们在纯数学及其应用中都起着重要作用。著名的黎曼假设断言,方程ζ=0的所有有意义的解都在一条直线上。当解是一个阿贝尔簇的点时,贝赫和斯维讷通-戴尔猜想认为,有理点的群的大小与一个有关的蔡塔函数z在点s=1附近的性态。特别是,这个有趣的猜想认为,如果z等于0,那么存在无限多个有理点(解)。

  • 煲仔饭要煮多久会熟 煲仔饭的做法要煮多久

    每一口煲仔饭里,都承载着家的味道,那是简单的力量,让人如此印象深刻甚至魂萦梦牵。煲仔饭要煮多久会熟上盖大火煮开后转小火煮8分钟,饭差不多就熟了。反正做煲仔饭,一开始下锅的水就一定要少就对了。煲仔饭有哪些种类煲仔饭的传统品种主要有豆豉排骨饭、腊味饭、滑鸡饭、黄鳝饭、田鸡饭、咸鱼香肉饭等,正宗的要用丝苗香米,取其坚实细密晶莹,口感好、滋味浓又易被汤汁浸烂。