科百科
当前位置: 首页 范文大全

电商平台数据分析工具有哪些(电商平台的行为数据分析平台附源码)

时间:2023-05-21 作者: 小编 阅读量: 2 栏目名: 范文大全

基于此强需求开发小象用户行为分析,兼容神策开源的埋点SDK完成终端行为上报,采用NginxFlumekafka实现日志收集,采用Flink写入HDFS。后续计划增加友盟和其他SDK厂商的埋点处理,以及业务系统日志的采集入库。服务端API由数据接入系统组成,采用Nginx来接收通过API发送的数据,并且将之写到日志文件上。使用Nginx主要是考虑到其高并发、高可靠性与高可扩展性。用户行为采集场景通过应用场景梳理,实现以场景规划埋点,用场景检验埋点。

项目介绍:

大数据技术已经迅速应用于商业并产生价值,通过数据分析来识别用户行为,建立以用户为中心的低成本快速增长,是一个企业必须具备的核心竞争力。 随着成本的大幅度增加,企业必须改变过去粗放型的营销和运营方式,特别是在市场营销、产品制造、销售以及未来的客户服务等各个方面向更加科学、高效的方向转变。

电商系统上线后,需要收集用户行为数据,通过大数据实时分析实现电商业务数字化运营。基于此强需求开发小象用户行为分析,兼容神策开源的埋点SDK完成终端行为上报,采用Nginx Flume kafka实现日志收集,采用Flink写入HDFS。

本开源项目内容包括nginx环境配置、Flume解密和日志格式处理、将明文数据存放到kafka的Topic下、Flink消费后将埋点数据存入HDFS的关键4步操作。为方便前期埋点的校验调优,在kafka环节,增加了埋点解析数据JSON格式存入MySQL。后续计划增加友盟和其他SDK厂商的埋点处理,以及业务系统日志的采集入库。

工程流程

完成数据采集技术构建和业务设计,在App、小程序的系统供应商配合下完成用户行为数据采集埋点,并基于埋点的数据构建线上用户行为标签和画像。

项目主要内容
  • 日志采集(Flume kafka)
  • 日志入库(Flink HDFS)
  • 设计思路

架构设计思路

所谓“埋点”,是数据采集领域(尤其是用户行为数据采集领域)的术语,指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。比如用户某个icon点击次数、观看某个视频的时长等等。

业务设计思路

埋点业务设计,首先需要根据业务分析明确采集的目标行为,进一步搞清楚应该在哪些地方埋什么样的点。过程中建议使用“事件模型( Event 模型)”来描述用户的各种行为,事件模型包括事件( Event )和用户( User )两个核心实体。 基于4W1H模型描述用户行为可将整个行为描述清楚,要点包括:是谁、什么时间、什么地点、以什么方式、干了什么。通过这两个实体结合在一起就可以清晰地描述清楚用户行为。

技术架构

SDK埋点采集行为数据来源终端包括iOS、安卓、Web、H5、微信小程序等。不同终端SDK采用对应平台和主流语言的SDK,埋点采集到的数据通过JSON数据以HTTP POST方式提交到服务端API。 服务端API由数据接入系统组成,采用Nginx来接收通过 API 发送的数据,并且将之写到日志文件上。使用Nginx实现高可靠性与高可扩展性。 对于Nginx打印到文件的日志,会由Flume的 Source 模块来实时读取Nginx日志,并由Channel模块进行数据处理,最终通过Sink模块将处理结果发布到 Kafka中。

软件完整架构第三方埋点SDK集成步骤
  • 引入SDK:在终端应用配置文件添加 SDK 依赖,不同终端引入方式会有差异,具体操作步骤将在后续SDK技术文档中体现。
  • 配置上报服务端API地址:用于设置SDK上报API的服务端地址。
  • 开启全埋点:SDK 可以自动采集一些用户行为,如 App 启动、退出、浏览页面、控件点击。初始化 SDK 时,通过SDK提供的初始化方法可以配置开启全埋点。
API接入服务设计

不同渠道的埋点数据通过 HTTP API 发送给服务端API实现数据接入。 采用Nginx作为WEB容器接收客户端SDK发送的数据,并且将之写到日志文件上。使用 Nginx 主要是考虑到其高并发、高可靠性与高可扩展性。

用户行为采集场景

通过应用场景梳理,实现以场景规划埋点,用场景检验埋点。场景梳理可以抽象为三个层面:

  • 通用基础场景:共性操作统一考虑
  • 重要操作场景:重要操作整体归因
  • 业务主流程场景:以业务线定义完整过程
应用效果

想要源码,记得关注 转发 私信,私信回复【数据分析平台

    推荐阅读
  • 腿抽筋的按摩方法(半夜腿抽筋疼痛难忍)

    引发腿抽筋的原因很多,包括寒冷刺激、缺钙、疲劳过度、血液循环不畅等。中医认为,寒性收引,即指寒邪侵袭人体,可使气机收敛,腠理、经络、筋脉收缩而挛急。夜里腿抽筋多见于老年人。应当及时就医,排查抽筋的原因。按摩这个穴位有助于缓解小腿肚抽筋、腿部劳累的症状。按揉这一穴位,有助于缓解下肢麻木。这四条建议,也有助于缓解夜间抽筋的现象。

  • 夜奶是几点到几点(宝宝夜奶几点喂)

    以下内容大家不妨参考一二希望能帮到您!母乳喂养的宝宝大都有吃夜奶的习惯,夜奶的计算,并不能按照我们日常的夜间作息来决定,而是看宝宝日常休息是几点钟,因为每个宝宝的睡眠周期以及睡眠时间都是不一样的,故晚上宝宝入睡后的加奶都算是夜奶。所以说,夜奶的时间是依据宝宝晚上入睡后的时间来算的。

  • 贵州抗疫拨款(贵州农信捐款1000万元支援贵阳抗疫)

    自贵阳地区发生疫情以来,贵州农信及时响应省委省政府疫情防控号召,部署落实系统防控工作,在保障疫情期间金融业务不中断,服务不降质的同时,9月14日,通过贵州省信合公益基金会向贵阳市红十字会捐赠1000万元,用于贵阳地区疫情防控和急需物资采购等。据统计,自2020年新冠肺炎疫情发生以来,贵州农信系统上下切实履行社会责任,累计向社会各界捐赠金额达4800万元,用实际行动彰显了“百姓银行”的社会责任担当。

  • 今天才发现第一句歌词这么有深意(有没有你觉得不能理解的歌词)

    博主@帅逼也搞笑的一条微博炸出了众多朋友。网友表示,其实斑马睡觉那句歌词是暗藏着一个动物冷知识的……@猫的树和我的你:动物界的冷知识:斑马独自一匹的时候是无法入睡的。斑马能够睡着是她已经找到了可以让她安心睡下的那个人而那个人却不是我。还有董小姐,你知道自己像河马的嘴吗???更无话可说的是@youki表示最难理解的歌词就是忐忑啊!

  • 一般什么时间段可以敷面膜(什么时候敷面膜好)

    晚上睡觉前当我们进入睡眠状态的时候,肌肤将处于一天当中细胞修复能力最强最旺盛的时段。当然,我们所说的睡觉时间,一定是不能超过11点的,所以9-11点是最佳的敷面膜时间。面膜一周最好使用两到三次,如果是去角质效果深层清洁面膜,要适当减少次数,一周一到两次就可以了。一定要做好后续保养,涂上化妆水及乳液,这样才能将面膜的营养成分紧紧的锁住。

  • 剑桥少儿英语三级考题(剑桥少儿英语考试一级)

    今天,我们来看下剑桥少儿英语考试的真题,考试总共有三级,分为starter(一级),mover(二级)和flyer(三级),starter适合小学一年级到二年级的孩子,mover适合小学三年级到四年级,flyer适合小学五年级到六年级。对于高年级的娃娃,如果掌握1000个词汇量,可以考虑冲刺下KET考试,小编在之前的帖子里讲过这个考试,点击报名遭秒抢,让北上广家长为之神伤的KET,PET英语考试到底是什么?剑桥少儿英语的starter一级考试,一共有三个模块,听力、读写、口语。

  • 杏仁巧克力奶酥(杏仁巧克力奶酥制作方法)

    跟着小编一起来看一看吧!杏仁巧克力奶酥取大小钢盆各一,将馅料的植物性奶油隔水加热融化,糖粉过筛后加入,以直型打蛋器拌打至松发变白。将奶水分次加入以刮面刀拌匀;把中筋面粉和奶粉一起过筛后,加入中拌匀成面煳。将面煳装入挤花袋中挤出长条形,即可放烤箱上层,以180℃烘烤约20分钟,待凉即为奶酥。将奶酥一端沾上巧克力,再撒上烤熟杏仁角即可。

  • 有翡海天一色跟谢允什么关系(有翡简介)

    有翡海天一色跟谢允什么关系海天一色跟谢允关系是:海天一色的计划当中,隐藏着谢允真正的身世。知情众人签订“海天一色”盟约保密,以水波纹为记。《有翡》是由华策克顿旗下好故事影视出品,吴锦源执导,赵丽颖、王一博领衔主演,张慧雯、陈若轩、孙坚、周洁琼、张昕宇、冷纪元主演,车晓、耿乐、董璇、胡兵特别出演的古装武侠剧。

  • 一年级数学思维训练一天一练(一年级数学思维训练)

    第1讲看图数一数数学上有很多重大的发现和疑难问题的解决都离不开推理,学会了推理,能使小朋友们头脑更灵活,变得更聪明。我们在思考此类问题时,要把所有的情况都考虑到,做到不重复也不遗漏,这样才能正确解题。对了,瓶子里的水位就会升高。下面,我们就来找一找变与不变的规律。在某一物体中再添加一些物体,总量就会增加,在某一物体中取走一些物体,总量就会减少。而仅仅是把物体改变它的形状或大小,质量就不会改变。

  • 近年英语六级总分数(英语六级分值公布明细)

    改革之后的英语六级成绩总分是710分,分别有四个单项,四个单项以及所占的分值占多少,分值各部分又是多少分,那接下来新航道西安学校老师给大家介绍的英语六级分值公布明细,各部分多少分?_新航道西安学校