看完抖音电商,你就明白字节AI终局布局

文章正文
发布时间:2024-12-20 11:02

国内电商在有淘宝京东这两个巨头的情况下,抖音电商还是杀出了自己的一条路,而且仅仅才用了3年的时间。这篇文章,作者就梳理了抖音电商的发展历程,一起来学习一下。

不服不行,抖音电商从圈外到圈内仅用了3年

一、发展历程

2020 年:抖音电商 GMV 近 2000 亿元,还为其他电商平台导流 3000 亿 GMV。6 月,抖音电商负责人康泽宇提出打造独立字节跳动电商生态的设想,希望商家和品牌通过抖音小店在抖音内完成交易、不再跳转外部平台;10 月,抖音不再允许第三方平台商品链接进入抖音达人直播间,抖音电商正式成立。

2021 年:抖音电商 GMV 完成 7300 亿元,呈现出快速增长态势。

2022 年:GMV 达到 1.41 万亿元,规模进一步扩大。

2023 年:商品交易总额(GMV)达 2.7 万亿,已十分接近同年京东的 3.47 万亿和拼多多的 3.2 万亿 GMV。

2024 年:预计 GMV 为 4 万亿,持续保持高速增长趋势。

二、发展成果

短短3年间,抖音电商从最初起步到逐渐建立起独立生态,GMV 不断攀升,增长速度迅猛,在 2024 年其 GMV 规模已挤进4巨头中的3巨头。传统电商巨头京东、拼多多在 GMV 方面的差距,越来越危险。

在抖音电商的探索期,诸多挑战如影随形。创作者深陷商品选择匮乏的泥沼,供应链体系亦漏洞百出。然而,抖音敏锐地捕捉到 AI 技术的巨大潜力,开启了在电商领域的 AI 探索之旅。

此阶段,抖音初步应用传统推荐系统及早期 AI 算法。借助内容推荐技术,抖音依据用户浏览的视频内容,尝试挖掘其潜在的商品兴趣;运用计算机视觉技术,对商品图片、视频进行智能识别与分析,以更好地理解商品特性;凭借自然语言处理技术,解读用户的评论、搜索关键词等文本信息,洞察用户需求;通过深度学习技术,不断优化对用户行为和商品特征的理解与关联。

抖音电商的推荐系统在探索期已具雏形,采用多层次召回和排序机制。它充分利用用户行为数据,如观看时长、点赞、评论、转发等,以及商品信息,如品类、价格、品牌等,运用协同过滤算法寻找具有相似兴趣的用户群体,基于内容推荐算法分析商品与用户兴趣的匹配度,并引入深度学习算法进行深度挖掘与预测,以此不断优化推荐效果,为用户提供初步个性化的商品推荐。

同时,在大数据处理、实时计算和 AI 技术方面,抖音逐步积累经验,为创作者工具和商家支持平台的智能化发展奠定基础。尽管初期困难重重,但抖音凭借这些技术创新与精准的推荐策略尝试,成功踏出电商业务成长的关键步伐,并预示着未来将借助 AI 技术持续深耕,进一步提升电商平台的效能与用户体验,在电商之路上砥砺前行,探索更多未知的可能。

「探索期」

2017 年底到 2018 年初,抖音上线购物车,购物袋两个产品,可以挂外网的链接,想要激发创作者创作带货。

自从抖音上线购物车功能开始,抖音电商业务开始逐渐从广告业务中脱离。但是受制于创作者不懂怎么组货,也不懂供应链,品牌方也没有人重视,一直都不温不火。抖音还尝试过通过付费流量的方式来分发商品,让商家在过程中赚取流量,但这个模式非常伤害用户体验,最终发展不如预期。

抖音电商自2017年底推出购物车、购物袋等功能,开始逐步独立于广告业务,推动创作者带货。

探索期的AI

然而,初期面临创作者缺乏商品选择和供应链不完善等挑战。随着时间推移,抖音通过AI技术推动电商业务发展,利用内容推荐、计算机视觉、自然语言处理和深度学习等技术提升用户体验。抖音的推荐系统基于海量数据,通过特征工程、模型训练和实时动态调整,为用户提供个性化的商品推荐。

抖音电商的推荐系统采用多层次召回和排序机制,实时更新推荐内容。系统利用用户行为数据和商品信息,通过协同过滤、内容推荐和深度学习等算法不断优化推荐效果。此外,抖音在大数据处理、实时计算和AI技术方面积累了大量经验,推动了创作者工具和商家支持平台的智能化发展。尽管初期面临困难,抖音通过技术创新和精准的推荐策略,成功促进了电商业务的成长,未来将继续通过AI技术进一步提升电商平台的效果和用户体验。

探索期主要应用传统推荐系统和早期AI算法

三、「发展期」

真正让抖音电商火起来是在2020 年,正值疫情期间,消费者出行受限、商家停工关门,线上购物需求大增。2020年4 月 1 日,抖音花了 6000 万签约了罗永浩,开启直播带货,在 3 小时 17 分钟的直播时间内,最终收获了超过 1.1 亿元人民币的销售额、4800 万累计观看人数、上了 2 次微博热搜。

2020 年 6 月,字节跳动内部将电商视为战略级业务,正式成立了以“电商”命名的一级业务部门,正式发布「抖音电商」品牌。同月,抖音小店官方应用程序“抖店”面世,抖店是一款集内容、营销、技术于一体的电商平台,为商家带来了更多的机遇和价值,作为商家官方操作后台,进一步完善了基础设施。2020 年 10 月起,抖音关闭所有第三方商品外链,与淘宝、京东、唯品会等电商平台进行“正面对决”。

发展期的AI

在这个期间抖音一方面发展内容推荐系统,另外一方面在物品与用户画像领域继续发展传统机器学习推荐系统。

四、「爆发期」

2021 年 1 月,抖音支付正式上线,此后成交、支付、物流均可在平台完成,抖音电商完成生态闭环。抖音开启电商节活动,1 月开启抖音抢新年货节,交易额飞速增长,较同比增长超50 倍。3 月开启抖音女王节。

抖音电商的 GMV 产生于两个场,分为内容场和货架场。

内容场主要以短视频、直播和图文为核心,集聚平台大部分流量,通过“货找人”的形式促成交易;

而货架场包括搜索、商城、店铺、达人橱窗等消费场景,以“人找货”为交易路径。

抖音电商成为中国四大电商平台之一,随着抖音一系列产品、运营和商家的策略的落地,抖音电商形成内容+货架的双驱动平台,凭借价格和供应链优势,让用户可以在逛的同时,又能够有更好的购物体验,更极致的价格。随着抖音电商规模的增大,对于商家来说选择性可以更多,对于用户来说也是好事。

爆发期的AI

推荐的本质是一个CTR预估问题。

如果是(用户)user的推荐,则是预估目标用户是否会和推荐的用户user产生某种联系,比如说关注,成为朋友等。

如果是短视频内容或者物品内容item的推荐,则是预估目标用户是否会点击item,然后产生后期的一些操作,比如消费等召回,多路召回,满足目标用户的方方面面的需求。

既需要满足目标用户近期的兴趣(新的兴趣),又需要满足用户的一些历史行为偏好,还需要根据u2u2i来扩展用户的兴趣点。

排序阶段,这个阶段需要模型。

这个模型就是针对每个召回的item进行ctr预估的一个概率。排序模型的输入包括2大部分,分别是user的特征(用户画像)和item的标签(标签体系)排序模型的输出是一个概率,及用户点击这个短视频的概率(我们推荐的是用户点击概率大的短视频)最后按照概率进行倒排,最后输出一部分概率较大的短视频。

传统常用的排序模型有:

GBDT+LR:通过GBDT得到组合特征,然后放在LR模型中进行概率的预测,GBDT是一棵决策树,从根节点到每一个叶子节点,都是一条路经,每一条路经都是一个组合特征。

然后把这些组合特征放在LR逻辑回归模型中进行训练,最后会给出一个概率。

wide&&deep:是LR和DNN的结合

FM:因子分解机deepFM

如下图:

现在常用的召回策略是多路召回

在多路召回中,无论是实时召回、基于内容召回、用户画像和短视频内容标签召回,亦或基于Queery召回,

在这个阶段常采用DNN的办法,对短视频抽帧然后放到DNN的模型中去训练,从而得到短视频的标签。

实现手段是DNN的最后一层是softmax,作为一个多分类的问题来处理。

将DNN在推荐系统中进行商业变现的第一人可以说他是朱文佳。

五、「AIGC时期」

2023-至今 抖音电商年GMV站上4万亿阶段,「电商已进入成熟期,AIGC深度全面应用恰巧进入普及期」。

抖音集团的推荐系统再也不需要数万人的标注团队了。

抖音的用户画像小组再也不用快速从2300人增加到3500人了。

抖音的数据采集不仅可以用GAN神经网络生成现在还可以用GAN加注意力机制引导数据生成了。

2023年年会梁汝波说字节得了大公司病,大公司该有的病字节一样没少,居然连大模型到2023年初字节才发现,1月30日,在2024年年度全员会上,字节跳动CEO梁汝波表示,如今的字节“该有的大公司病全有了”。

梁汝波也举了一个例子,说公司半年度技术回顾时,发现2023年才开始讨论ChatGPT,别的大模型创业公司甚至早在2018年都已经成立了。

算法即人才

然后2024年的字节与大模型像久旱逢甘霖一样,2024年全年快速构建AI组织。

将DNN用于推荐系统商业变现的字节推荐系统tops人选朱文佳,从今日头条推荐系统负责人,到今日头条CEO,再到tiktok产品技术负责人,直接负责字节大模型,一开始叫语雀大模型,再叫seed大模型,然后就成了闻名遐迩的豆包大模型。

另外字节工程团队洪定坤和产品技术负责人朱俊开始负责Flow的技术工程和产品技术,飞书的齐俊元开始负责Flow的产品。这些产品的底层模型统一调用豆包大模型的底层自然语言理解能力。

还有张楠负责的剪映、即梦AI等开始调用豆包大模型的语义理解和语义生成能力。

2024年的字节是算法年,算法主要是由人才构建,人才上自己构建1:3高密度AI大模型算法人才。

例如:挖面壁智能大模型负责人,挖阿里通义千问大模型负责人,挖零一万物大模型负责人等等,来构建字节大模型的算法底座。

字节跳动搜寻AI人才的方式可以用狩猎式敛才。

算力即资金 六、字节跳动数据中心基建:从 0 到 100 的 AI 战略布局 1. 资本开支与战略决心

在互联网科技巨头的资本竞赛中,字节跳动展现出了远超预期的投入力度。与 BAT 三家 2024 年总计约 1000 亿人民币的资本开支相比,字节跳动仅在 2024 年就达到了 800 亿人民币。而 2025 年,其资本开支预算更是飙升至近 1600 亿人民币,彰显了其在 AI 领域大规模布局的坚定决心。

2. 资金分配与业务布局

AI 算力采购:其中约 900 亿人民币将用于 AI 算力的采购,国内计划投入 400 亿人民币,国外(主要是东南亚地区)投入 500 亿人民币,以构建强大的 AI 计算能力基础。

IDC 基建与网络设备招标:其余 700 亿人民币则分配给 IDC 基建以及网络设备如光模块、交换机的招标,国内 500 亿人民币,国外 200 亿人民币,旨在打造自主可控的大规模数据中心集群。

3. 发展历程与战略转型

此前,字节跳动主要依赖外部采购算力,机房资源多来源于第三方。然而,如今公司决定全面开启自主大规模兴建 AI 数据中心的征程,从 IDC 基础设施建设入手,积极开展大规模集群建设,并全面推进光模块、交换机等设备的招标工作,标志着字节跳动在 AI 数据中心领域从无到有、从依赖到自主的重大战略转型。

4. 领导重视与未来展望

字节跳动创始人张一鸣亲自挂帅,全力推动这一战略布局,展现出对 AI 领域的 “All in” 决心,不惜重金投入,旨在打造领先同行的竞争优势。从博通 2027 年的自研 ASIC 计划及数量来看,字节跳动未来的 AI 数据中心规模预计将达到百万卡级别。目前虽处于起步阶段,仅采购数万至数十万张卡进行算力堆砌,但这一跨越性的举措已预示着字节跳动将在 CSP 类型的产业中掀起巨大波澜,引领行业的未来发展趋势。

同时字节跳动也是Nvidia中国区最大的客户,如图:

N卡即Nvidia的系列卡,字节主要用来做预训练,接下来数据中心的构建字节主要是用来做推理,推理的还是会有越来越多的国产GPU,例如:华为、天数智芯等提供的算力支撑。

七、字节跳动数据中心基建的进展如下: 1. 国内进展

和林格尔算力中心:2024 年 11 月,和林格尔新区国土空间规划委员会原则通过了火山引擎内蒙古和林格尔算力中心一期 A 项目规划设计方案审查事宜,该中心作为字节跳动紧抓国家 “新基建” 发展战略及全国一体化大数据中心协同创新体系算力枢纽建设机遇的重点项目,正稳步推进前期规划工作.

张家口数据中心:字节跳动在国内有张家口数据中心,并且还在不断加大投入,进行相关设施建设与技术升级等,以满足日益增长的业务需求.

2. 海外进展

马来西亚:2024 年 6 月,字节跳动计划在马来西亚投资 100 亿林吉特(约合 21 亿美元)建立一个区域人工智能中心,并追加 15 亿林吉特投资用于扩建其在马来西亚柔佛州的现有数据中心设施.

泰国:据 2024 年 10 月消息,字节跳动旗下 BytePlus 正在考虑 2025 年在泰国建立一个数据中心,以提供云计算和人工智能服务.

爱尔兰:2020 年 8 月,字节跳动旗下 TikTok 计划在爱尔兰建设一座数据中心,投资额约 5 亿美元,用于存储欧洲用户在该 App 上产生的数据信息,数据中心将在未来 18 到 24 个月内投入运营,创造数百个新岗位.

美国弗吉尼亚:字节跳动在美国弗吉尼亚建有数据中心,为其在北美地区的业务提供数据存储和处理支持.

新加坡:字节跳动在新加坡也设有数据中心,并且部分数据有在新加坡备份,保障数据的安全性和业务的稳定运行

八、数据即产品 1. 大模型

字节有豆包大模型,Flow大模型,seed大模型等等,目前看字节基座大模型有被豆包大模型兼并的可能性。

豆包通用模型 pro:字节跳动自研 LLM 模型专业版,支持 128k 长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景;

豆包通用模型 lite:字节跳动自研 LLM 模型轻量版,对比专业版提供更低 token 成本、更低延迟,为企业提供灵活经济的模型选择;

豆包·角色扮演模型:个性化的角色创作能力,更强的上下文感知和剧情推动能力,满足灵活的角色扮演需求;

豆包·语音合成模型:提供自然生动的语音合成能力,善于表达多种情绪,演绎多种场景;

豆包·声音复刻模型:5 秒即可实现声音 1:1 克隆,对音色相似度和自然度进行高度还原,支持声音的跨语种迁移;

豆包·语音识别模型:更高的准确率及灵敏度,更低的语音识别延迟,支持多语种的正确识别;

豆包·文生图模型:更精准的文字理解能力,图文匹配更准确,画面效果更优美,擅长对中国文化元素的创作;

豆包·Function call 模型:提供更加准确的功能识别和参数抽取能力,适合复杂工具调用的场景;

豆包·向量化模型:聚焦向量检索的使用场景,为 LLM 知识库提供核心理解能力,支持多语言。

对9款豆包大模型家族,字节不强调参数、不强调数据和语料,直接把模型能力在场景里做了垂直细分,这个决策因素是有应用和没有应用的区别,更本质的是有数据和没数据的区别。

有用户反馈、有数据反馈,字节能够根据用户和数据的反馈去做更精准的场景和服务。

字节在 AI 大模型上,是数据逻辑,根据不同的数据链反馈,决定产品或者模型的下一步动作。

2. 字节跳动大模型产品

大模型承载着这家「App 工厂」的大模型产品思路,字节内部 50 多个业务已经大量使用豆包大模型进行 AI 创新,包括抖音、番茄小说、飞书、巨量引擎等,用以提升效率和优化产品体验。

另外字节跳动也基于豆包大模型打造了一系列 AI 原生应用,包括 AI 对话助手「豆包」、AI 应用开发平台「扣子」、互动娱乐应用「猫箱」,以及星绘、即梦等 AI 创作工具。

AI大模型的APP工厂依然是在做数据,AI原生的扣子、豆包、即梦、星绘都在做数据。

相反,如果只做基础模型,不做服务升级,场景反馈、用户数据反馈会越来越少,模型能力的差别就会拉开。

【布局】

在抖音短视频的浪潮中,字节跳动曾乘风破浪,尽享流量红利带来的无限荣华。然而,时代的车轮滚滚向前,AIGC 大模型的浪潮汹涌而至,字节跳动深知,曾经的辉煌如过眼云烟,若不能在这新的浪潮中再次崛起,往昔的荣耀将转瞬即逝。

如今,字节跳动怀揣着对未来的笃定与渴望,决心在 AIGC 领域复刻抖音的传奇。就如同嘉里中心香格里拉酒店近期的景象一般,以往晚上十点半仍有半数蛋糕剩余,而如今,因那棵如 AIGC 大模型般闪耀的圣诞树所营造的圣诞集市氛围,蛋糕一日三茬皆被抢购一空,三楼餐厅从下午两点营业至晚上十点,预约需提前一周,一楼卡座亦一席难求。这圣诞树象征着 AIGC 大模型赋予字节跳动的新机遇与无限可能,它是字节跳动续写辉煌、永葆荣耀的关键所在,是开启下一个流量盛世与商业传奇的魔法钥匙。

专栏作家

连诗路AI产品,公众号:AI产品有思路。人人都是产品经理专栏作家,《产品进化论:AI+时代产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多交流。

首页
评论
分享
Top