科百科
当前位置: 首页 范文大全

电商平台数据分析工具有哪些(电商平台的行为数据分析平台附源码)

时间:2023-05-21 作者: 小编 阅读量: 2 栏目名: 范文大全

基于此强需求开发小象用户行为分析,兼容神策开源的埋点SDK完成终端行为上报,采用NginxFlumekafka实现日志收集,采用Flink写入HDFS。后续计划增加友盟和其他SDK厂商的埋点处理,以及业务系统日志的采集入库。服务端API由数据接入系统组成,采用Nginx来接收通过API发送的数据,并且将之写到日志文件上。使用Nginx主要是考虑到其高并发、高可靠性与高可扩展性。用户行为采集场景通过应用场景梳理,实现以场景规划埋点,用场景检验埋点。

项目介绍:

大数据技术已经迅速应用于商业并产生价值,通过数据分析来识别用户行为,建立以用户为中心的低成本快速增长,是一个企业必须具备的核心竞争力。 随着成本的大幅度增加,企业必须改变过去粗放型的营销和运营方式,特别是在市场营销、产品制造、销售以及未来的客户服务等各个方面向更加科学、高效的方向转变。

电商系统上线后,需要收集用户行为数据,通过大数据实时分析实现电商业务数字化运营。基于此强需求开发小象用户行为分析,兼容神策开源的埋点SDK完成终端行为上报,采用Nginx Flume kafka实现日志收集,采用Flink写入HDFS。

本开源项目内容包括nginx环境配置、Flume解密和日志格式处理、将明文数据存放到kafka的Topic下、Flink消费后将埋点数据存入HDFS的关键4步操作。为方便前期埋点的校验调优,在kafka环节,增加了埋点解析数据JSON格式存入MySQL。后续计划增加友盟和其他SDK厂商的埋点处理,以及业务系统日志的采集入库。

工程流程

完成数据采集技术构建和业务设计,在App、小程序的系统供应商配合下完成用户行为数据采集埋点,并基于埋点的数据构建线上用户行为标签和画像。

项目主要内容
  • 日志采集(Flume kafka)
  • 日志入库(Flink HDFS)
  • 设计思路

架构设计思路

所谓“埋点”,是数据采集领域(尤其是用户行为数据采集领域)的术语,指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。比如用户某个icon点击次数、观看某个视频的时长等等。

业务设计思路

埋点业务设计,首先需要根据业务分析明确采集的目标行为,进一步搞清楚应该在哪些地方埋什么样的点。过程中建议使用“事件模型( Event 模型)”来描述用户的各种行为,事件模型包括事件( Event )和用户( User )两个核心实体。 基于4W1H模型描述用户行为可将整个行为描述清楚,要点包括:是谁、什么时间、什么地点、以什么方式、干了什么。通过这两个实体结合在一起就可以清晰地描述清楚用户行为。

技术架构

SDK埋点采集行为数据来源终端包括iOS、安卓、Web、H5、微信小程序等。不同终端SDK采用对应平台和主流语言的SDK,埋点采集到的数据通过JSON数据以HTTP POST方式提交到服务端API。 服务端API由数据接入系统组成,采用Nginx来接收通过 API 发送的数据,并且将之写到日志文件上。使用Nginx实现高可靠性与高可扩展性。 对于Nginx打印到文件的日志,会由Flume的 Source 模块来实时读取Nginx日志,并由Channel模块进行数据处理,最终通过Sink模块将处理结果发布到 Kafka中。

软件完整架构第三方埋点SDK集成步骤
  • 引入SDK:在终端应用配置文件添加 SDK 依赖,不同终端引入方式会有差异,具体操作步骤将在后续SDK技术文档中体现。
  • 配置上报服务端API地址:用于设置SDK上报API的服务端地址。
  • 开启全埋点:SDK 可以自动采集一些用户行为,如 App 启动、退出、浏览页面、控件点击。初始化 SDK 时,通过SDK提供的初始化方法可以配置开启全埋点。
API接入服务设计

不同渠道的埋点数据通过 HTTP API 发送给服务端API实现数据接入。 采用Nginx作为WEB容器接收客户端SDK发送的数据,并且将之写到日志文件上。使用 Nginx 主要是考虑到其高并发、高可靠性与高可扩展性。

用户行为采集场景

通过应用场景梳理,实现以场景规划埋点,用场景检验埋点。场景梳理可以抽象为三个层面:

  • 通用基础场景:共性操作统一考虑
  • 重要操作场景:重要操作整体归因
  • 业务主流程场景:以业务线定义完整过程
应用效果

想要源码,记得关注 转发 私信,私信回复【数据分析平台

    推荐阅读
  • 描写看书看得入神的句子(形容看书看得入神的句子)

    5、刘文一晚上都在书房里看书,天亮了也没感觉到。

  • 车子起步抖动的原因(要注意什么)

    离合器衬片接触不良离合器衬片接触不良,表面硬化或粘上胶状物,容易引起离合器发抖。此时应重新接离合器衬片。从动盘翘曲、歪斜和变形从动盘翘曲、歪斜和变形时,在离合器接合过程中离合器衬片会产生不规则接触,压力不能平顺地增大。起步时离合器踏板、加速踏板和制动踏板配合不当。起步后仍将左脚放在离合器踏板上或起步时忘了将驻车制动杆松开。

  • 精准引流推广技巧有哪些方法(推广引流方法有哪些)

    推广引流,永远都是一个具有争议的话题。一、推广引流方法有哪些推广引流方法有很多,具体的我们来一起看下有哪些:序号引流方法具体内容1网站引流法外链发布内容2评论引流法信息截留法3问答引流法通过问答平台自问自答4QQ群、微信群引流法QQ群、微信群发广告5线下引流法线下活动、卡片、移动广告6头像引流法头像更改为产品或服务名称7红包引流法利益引诱法8邮箱引流EDM邮件营销二、推广引流需要注意什么?

  • 狗狗流脓真菌感染治疗方法(狗狗伤口化脓一直流水怎么办才好)

    狗狗伤口一直化脓的话,宠物主人就要及时进行处理了,如果伤口面积过大或是比较严重的建议送往宠物医院,不严重的可以在家处理。平时要多给狗狗喂食有营养的食物,可以是汪想羊奶粉、鸡胸肉、牛肉、营养膏、罐头等等,加强营养能让伤口好得更快。

  • 烤蛋挞瓤的制作方法(烤蛋挞瓤的制作方法介绍)

    下面内容希望能帮助到你,我们来一起看看吧!烤蛋挞瓤的制作方法原料:鸡蛋2个、一勺白糖、一勺面粉、一盒纯牛奶。搅拌均匀,过滤到烤盘中,烤箱预热200度,烤20分钟,时间到就可以了。

  • 斯柯达两厢版长宽高(两厢的斯柯达车身尺寸多少)

    斯柯达两厢版长宽高斯柯达两厢版车身尺寸为长*宽*高4312mm*1706mm*1475mm,车的轴距为2603mm。斯柯达在100多年的发展历程中,经历了多次的战乱、政变和兼并,坚韧不拔地谱写出斯柯达辉煌的历史篇章,显示了惊人的生存功夫!目前,斯柯达的产品主要有柯迪亚克、柯迪亚克GT、柯米克、柯珞克、速派、明锐、明锐旅行车、昕动、昕锐以及晶锐。

  • leetcode两数之和题解析(LeetCode每日一题两数之和)

    对于每一个元素x,我们可以O地寻找target-x空间复杂度:O,其中N是数组中的元素数量。主要为哈希表的开销结果执行用时:0ms,在所有Java提交中击败了100.00%的用户内存消耗:38.7MB,在所有Java提交中击败了47.28%的用户,

  • 口碑网剧古装女主(独家古装IP收视遇冷)

    据悉,《还是夫妻》由华谊兄弟庄立奇工作室、中央电视台联合出品,著名导演张晓光执导,马苏、郭涛、苏岩、韩青、周晓鸥等一众靠实力的优秀演员联袂出演。由马苏、郭涛饰演的“筱健”夫妇,女主外男主内,完全颠覆了传统的家庭分工,看点十足。诸如此类点睛之语,在剧中比比皆是。作为华谊兄弟庄立奇工作室的良心之作,《还是夫妻》必将引领婚恋轻喜剧的新浪潮。

  • 有关西游记的成语谚语(西游记中的成语)

    窑头土坯菩提祖师的解释是:“就如那窑头上,造成砖瓦之坯,虽已成形,尚未经水火煅炼,一朝大雨滂沱,他必滥矣。”水中捞月菩提祖师的解释是:“月在长空,水中有影,虽然看见,只是无捞摸处,到底只成空耳。”人的自然寿命应为其生长发育期的5到7倍,一般人的生长发育期是20~25岁,这样算起来人类的寿命极限就应该是100到175岁。生长发育期就是从出生到发育成熟这一阶段。绝大多数人都没有尽天年,无非是自然、人为等因素所致。