懒人听书算法备案公示说明


     为依法保障用户对懒人听书算法服务的基本原理、目的意图和主要运行机制等的知情权,告知用户懒人听书提供的算法服务的备案情况,我们制定本《懒人听书算法备案公示说明》,帮助用户了解在使用懒人听书产品和服务的过程中我们如何通过算法技术向用户提供信息和服务,充分保障用户的合法权益。

 

一、算法名称 懒人听书个性化推荐算法

备案号:网信算备440305019182802230019号


算法基本原理

根据用户收藏、完播、下载资源的行为,通过多重筛选机制,确定用户对音频和相关内容的兴趣范围,推荐系统在确定用户喜好后,在系统内部对相关目标内容,将相关内容进行打散后,再进行筛选后推荐给用户,方便用户进行收听。


 算法运行机制

1.资源i2i 召回模型:用于召回阶段,每日更新,使用播放、收藏、付费流水数据训练。模型为swing 模型,无指定优化目标。

2.用户u2i 召回模型:用于召回阶段,每日更新,使用播放、收藏、订单流水数据训练,优化目标为播放时长、付费和收藏。模型生成用户感兴趣资源id,直接用于推荐。

3.用户u2i2i 召回模型:用于召回阶段,每日更新,使用播放流水和标签数据。推荐用户与用户观看过的资源相似(同标签、同作者、同主播)的资源。

4.热门召回:用户召回阶段,每日更新,使用播放流水,推荐最近播放量最高的资源。

5.优质资源召回:推荐运营标记的高质资源。

6.精排模型:用于排序阶段,每日更新,模型结构为deepfm,优化目标为播放时长,评价指标为auc。包含书籍/节目id,章节时长、文件大小,分类id(编辑提供,有审核)


算法应用场景

懒人听书推荐页—猜你想听模块

 

算法目的意图

从海量推荐池中,帮助用户发现美好事物;结合用户历史兴趣偏好,提升好内容的挖掘效率。

 

二、算法名称 懒人听书榜单算法

备案号:网信算备440305019182803230015号


算法基本原理

榜单主要基于用户的搜索、播放、付费、评论等行为数据 统计资源的用户行为表现,再按资源维度圈定资源池进行排序。

 

算法运行机制

1.统计资源的播放量、下载量、评论量、收藏量、搜索量、销售量,得到资源各维度的统计数据

2.根据分类、付费、连载状态等圈定资源范围,并根据内容等级、风险等级、审核等级进行过滤

3.对圈定出的资源基于统计值进行排序 并进行内容过滤后 得到算法榜单

4.支持根据特定主题 设置自定义榜单

 

算法应用场景

算法计算出的榜单数据主要呈现在懒人听书榜单页。

入口:懒人听书APP首页菜单栏,点击榜单可进入榜单页

 

算法目的意图

根据用户的搜索、播放、付费、评论等行为数据及资源的类别、付费、上新等数据计算各类榜单,帮助用户快速发现热门资源。

 

三、算法名称 懒人听书搜索算法

备案号:网信算备440305019182804230011号

 

算法基本原理

针对系统中书籍、节目、阅读、主播、听单等资源 的相关信息分词后建立倒排索引,搜索时对用户搜索关键词进行分词,通过查询倒排索引进行召回,并根据匹配度和热度进行综合排序。

 

算法运行机制

1.提前针对系统中书籍、节目、阅读、主播、听单等资源的相关信息分词后建立倒排索引

2.接受到用户搜索请求后,确定用户的搜索场景和可使用的资源池

3.对搜索关键词进行分词,采用前缀、短语、混合等搜索策略从倒排索引中召回资源

4.基于资源基础信息和消费情况和搜索匹配模式进行排序,提取混合排序的头部资源

5.渲染资源信息,并展示给用户

 

算法应用场景

算法主要应用于懒人听书搜索页,为用户提供搜索系统内资源的能力。

入口:懒人听书APP各主界面点击搜索框均可进入搜索页

 

算法目的意图

根据用户输入关键词,搜索系统中书籍、节目、阅读、主播、听单等资源,帮助用户找到符合需求的资源。

 

提交反馈