最新要闻
- 北京市市场监管局机场分局圆满完成暑运服务保障工作
- 民生证券李哲:人形机器人产业化进程有望加速
- 江西税务:税收“童”行 满“新”欢喜
- 振兴突破看汽开丨长春市汽车产业集群产教联合体入围首批国家级市域产教联合体
- 贺兰山东麓旅游环线项目建议书获批
- 杭州亚运会如何践行“绿色、智能、节俭、文明”?
- 2023世界文化旅游名城太原论坛开幕
- 昆明20余个地点举办火把节 诚邀游客感受火之魅力
- 2023北京绿野仙踪郊野乐园教师节免费入园活动
- 云顶dnf手游怎么玩 云顶dnf手游新手入门玩法攻略[多图]
- 沪深两市成交额突破4000亿元:据同花顺iFinD数据,截至目前,沪深两市成交额突破4000亿元
- 张雪峰再遭华为“背刺”!刚换Mate 60 Pro四天 Pro+发布了
- 马斯克讽刺苹果iPhone没新意遭果粉回怼:特斯拉也是
- 中国彩妆行业市场分析:赛道景气度探底回升,国货彩妆品牌加速崛起
- 港交所9月8日全日停市
- 江苏盐城:九龙口湿地生态美
手机
广西华侨学校120多名留学生开启新学期学习生活
泰国警方破获盗卖文物案 缴获古董文物近千件
- 广西华侨学校120多名留学生开启新学期学习生活
- 泰国警方破获盗卖文物案 缴获古董文物近千件
- 开学第一课 夯实护路进校园
- 英第二大城市“事实破产” 首相称不会提供帮助
- 官宣即炸裂,疯马秀到底是什么?
- 突破600元/克 黄金首饰价格上涨 销售火爆
家电
指令微调LLM进行推荐Recommendation as Instruction Following: A Large Language Model Empowered Recommendation Approach
原文地址:https://arxiv.org/abs/2305.07001
本文作者将用户偏好、意图等构建为指令,并用这些指令调优一个LLM(3B Flan-T5-XL),该方法对用户友好,用户可以与系统交流获取更准确的推荐。
INTRODUCTION
LLM是建立在自然语言文本上的,它不能直接适应基于行为数据的推荐系统。为了减少两者的gap,一种思路是将行为建模视作语言建模。在这种方法中,有两个关键问题:
(资料图片)
- 如何表达推荐任务?通常来说,成功的推荐依赖对user需求的准确理解,因此需要设计一种合适的形式包含用户需求的各种信息,包括交互历史、用户偏好、用户意图等个性化因素。
- 如何使LLM适应推荐?尽管LLM能够对自然语言建模,并且它有一定的通用性,但是它还是难以处理复杂的任务,需要特定的调整策略,将LLM调整为适应推荐任务。
作者提出了一种方法InstructRec解决以上问题,其主要有两个贡献:
- 推荐指令格式说明。
- 用指令调优的LLM进行推荐。
指令中的用户偏好、意图是使用GPT3.5基于用户的历史行为生成的。
METHODOLOGY
Instruction Format for Recommendation
指令的格式。
Key Aspects in Instructions
指令的关键方面有三个:用户的偏好、意图及任务形式。
Preference (P):用户的偏好,指用户对item的属性或特征的个性化品味。在本文的指令中,旨在捕获用户固有的长期偏好。可分为以下三类
- None (\(P_0\)):在这种情况下,没有用户偏好或信息可用。
- Implicit preference (\(P_1\)):隐式偏好,用户的个人信息和历史交互记录可用,但是没有明确表示出用户显示偏好。在使用历史交互记录时,不使用其ID,而是使用其标题作为文本信息。
- Explicit preference (\(P_2\)):显示偏好,本文主要考虑用户在文本中的表达,例如评论。
Intention (I):指用户对某些类型的item更直接的需求。
- None (\(I_0\)):用户缺乏明确目标。
- Vague intention (\(I_1\)):用户对需求item模糊的表述,例如“送儿子的礼物”。
- Specific intention (\(I_2\)):用户有明确的需求,例如“蓝色、便宜、IPhone13”。
Task Form (T):本文提出了以下几种任务形式
- Pointwise recommendation (\(T_0\)):判断当前item是否适合用户。
- Pairwise recommendation (\(T_1\)):将一对item进行比较并选出更合适的。
- Matching (\(T_2\)):从全体item中选出合适的。
- Reranking (\(T_3\)):对已检索出的item进行重排。
除上述三部分外,还可以加入一些上下文特征(时间地点等)。
Instantiation for Various Interaction Scenarios
本节介绍了几个具有代表性的实例。
- ⟨\(P_1/P_2,I_0,T_3\)⟩:在这个实例中,专注于用户的兴趣。LLM充当传统的推荐系统。
- ⟨\(P_0,I_1/I_2,T_3\)⟩:在这个实例中LLM充当检索器。
- ⟨\(P_1/P_2,I_1/I_2,T_3\)⟩:个性化搜索。
因为LLM推理成本较高,所以LLM更适合用于重排阶段,在本文中也主要讨论\(T_3\)任务。
Instruction Generation
通过提示GPT3.5用户的历史行为和评论来为用户生成个性化信息。
Annotating the Aspects in Instructions
Preference annotation:对于隐式偏好取标题,显示偏好通过GPT3.5提取。
Intention annotation:类似于偏好提取。显示意图可以用标签表示。
Task form annotation:对于\(T_0\),需要构建指令类似于“基于<用户相关的信息>,用户之后会与
- 交互吗?”,系统只需要回答“是”或“否”。对于任务\(T_2\),构建指令类似于“预测下一个可能交互的物品”。对于任务\(T_3\),构建指令类似于“从<候选集>中选择一个物品”。
Enforcing the relatedness between preference and intention
提高指令数量和多样性有利于提高推荐效果,以下是作者提出增加指令多样性的一些策略
Turn the task around:对正常指令的输入输出交换。
Enforcing the relatedness between preference and intention:长期偏好和短期意图应该高度相关。
Chain-of-thought (CoT) like reasoning:在中间推理步骤中添加了额外的解释,使LLM能够执行复杂的推理任务。
Instruction Tuning for Recommendations
- The Backbone LLM:3B Flan-T5-XL
- Optimization via Instruction Tuning:本质上是一种有监督微调,根据不同的指令提供期望的系统回答。由于指令和目标输出都可以以自然语言格式化,我们可以将训练统一为sequence-to-sequence方式。
EXPERIMENTS
Sequential Recommendation ⟨\(P_1,I_0,T_3\)⟩:序列推荐任务上的表现
Product Search ⟨\(P_0,I_2,T_3\)⟩:产品搜索上的表现
Personalized search ⟨\(P_1/P_2,I_1/I_2,T_3\)⟩:个性化搜索上的表现
Discriminating Hard Negative Item Candidates:区分难负例的表现,模拟真实推荐中的重排通道
Discriminating More Candidate Items:从更大的候选集中选item,其它实验候选集大小都是10,这个实验是100
Effects of Instructions:指令的效果,不断在基础指令上叠加更多指令
Generalization across Datasets:跨域推荐,上面两种传统的推荐方法在进行了正常的域内训练,下面的基于LLM的推荐是在亚马逊“Games”数据集上微调,在“CDs”数据集上测试
SUMMARY
本文主要讲的是通过指令微调LLM并用LLM进行推荐,经过精心设计的指令微调后的LLM在多种场景下的推荐表现出不错的效果。但是,由于LLM无法很好地处理长文本,LLM难以对用户较长的序列进行建模,文中实验生成所用的行为序列大小被限制为20,测试时重排的集合大小更是只有10,在实际中的推荐系统数据要比这些大的多。目前,微调LLM进行推荐还在初步阶段,有很多有前景的方向值得探索,包括如何生成让LLM更易于理解的指令、如何使用更长的行为序列等。
关键词:
-
指令微调LLM进行推荐Recommendation as Instruction Following: A Large Language Model Empow
原文地址:https: arxiv org abs 2305 07001本文作者将用户偏好、意图
来源: 指令微调LLM进行推荐Recommendation as Instruction Following: A Large Language Model Empow
已见繁花结硕果 山西晋中特色专业镇发展成效显著——专访山西省晋中市委常委、副市长张鹏
心理恐怖游戏《永无止境》预告公布:9月14日发售
《星空》官方宣传图发布 《光环》魔改图
界首市:查找风险点 保障工程建设向廉而行
北京:“千年一线 中轴印象”2023东城区中轴摄影展开幕
关键配套能力持续增强 重庆智能网联新能源汽车产业“串珠成链”
诵一首诗 添一抹蓝 “城市正添蓝”诗歌音乐会在东城举办
建阳开展水稻制种基地联检联查
“台湾特色主题街”亮相东莞台博会带来浓厚“台”味
滴滴获评“中华慈善奖”
张惠强当选广西玉林市市长
北京市市场监管局机场分局圆满完成暑运服务保障工作
广西华侨学校120多名留学生开启新学期学习生活
走进济南这几座跨河桥下,与故事中的他们来场穿越时空的相逢
泰国警方破获盗卖文物案 缴获古董文物近千件
民生证券李哲:人形机器人产业化进程有望加速
农业银行传世之宝金条价格今天多少一克(2023年09月08日)
让数据多跑路,让群众少跑腿:河北唐山公安政务实现 “一窗通办”
河北饶阳:勤学成风尚 图书馆里氛围浓
中华经典诵读大会暨传统乐器展演今日于郑州启幕
加拿大央行维持现行利率 称必要时将再加息
让爱留守 湖南省温暖工程基金会为乡村孩子送去急救知识
加快“五好”园区建设 为县域经济提供强力支撑
灵隐寺回应出奶茶:灵隐奶茶纯属商家个人行为
国家级水稻科技创新平台落户宝清
新蔡县公安局龙口派出所:及时找回走失小孩
江西与东盟国家对接产教融合发展 共谋“职教出海”
主动要求下场!梅西有多累?双线连轴转,赛后老干部式插兜
江西税务:税收“童”行 满“新”欢喜
南关区委常委、副区长魏东走访科技创新产业链企业
振兴突破看汽开丨长春市汽车产业集群产教联合体入围首批国家级市域产教联合体
长春市第一届运动会开幕
辽宁省首届中国画水墨展举行
2023年新闻记者职业资格考试开始报名
贺兰山东麓旅游环线项目建议书获批
【柬•华商日报】青藏铁路通车17周年 累计运送旅客2.73亿人次
三批城市一刻钟便民生活圈试点已覆盖150个地区
罗田2023年移民茶叶技能培训受欢迎
中国文物学会会长、故宫博物院学术委员会主任单霁翔:讲好中国故事 做好文化交流使者
杭州亚运会如何践行“绿色、智能、节俭、文明”?
2023世界文化旅游名城太原论坛开幕
打卡地+7,乐山这些芦苇丛拍照绝绝子!
2023上海书展开幕 书迷“淘书”逛展乐趣多
成都如何打造中国音乐演艺“第三城”?—中国新闻网·四川新闻
廿四节气|千里江山图之处暑篇
@四川考生,本月教育考试有7大报考热点—中国新闻网·四川新闻
天津津南区打造“澜海话室” 巧解基层信访难题
宝塔实业(000595):股价5分钟涨速大于5%(09-08)
博乐市“警企联络室”挂牌成立
开学第一课 夯实护路进校园
昆明20余个地点举办火把节 诚邀游客感受火之魅力
奔驰召回部分进口及国产汽车,共计32625辆
9月7日基金净值:广发央企创新ETF最新净值1.3447,跌1.17%
天山铝业:公司120万吨电解铝产能都位于新疆石河子市
贪腐被举报 国企董事长扎小人报复 杨春晓贪腐细节揭秘
2023北京绿野仙踪郊野乐园教师节免费入园活动
英第二大城市“事实破产” 首相称不会提供帮助
各地加强田间管理 秋粮长势总体正常
腾讯发布混元大语言模型,为产业场景构建大模型应用
希捷推出《星空》版Game Drive:可编程RGB灯效 2TB仅需1006元
航宇微:9月7日融资买入3917.69万元,融资融券余额6.05亿元
首都在线:后续将陆续扩大和国产芯片厂商的合作
高盛:若OPEC+继续延长减产 2024年底油价将冲击三位数!
官宣即炸裂,疯马秀到底是什么?
吉林好“丰”景丨晒葫芦条!这份丰收“很东北”
神秘新作《替罪羊》预告网站上线 9月15日正式公布
今年秋粮面积预计达13.1亿亩 眼下秋粮长势如何?
云顶dnf手游怎么玩 云顶dnf手游新手入门玩法攻略[多图]
沪深两市成交额突破4000亿元:据同花顺iFinD数据,截至目前,沪深两市成交额突破4000亿元
张雪峰再遭华为“背刺”!刚换Mate 60 Pro四天 Pro+发布了
马斯克讽刺苹果iPhone没新意遭果粉回怼:特斯拉也是
国家体育总局:推出一批“体育+文旅”优质文体旅融合产业项目
上海数据交易所今年交易额有望突破10亿元
特一药业:公司目前暂无研发保健品的计划
上海数据交易所今年交易额有望突破10亿元 2025年目标100亿元
多彩仙禽来了!武汉野生动物王国“彩翼谷”首次对外开放
渑池交通运输执法大队:全面从严管党治队工作取得阶段性成效
日本媒体质疑孙颖莎偷招,陪练张本被批,20时,张本回应太打脸
雷雨天气过敏患者骤增 该如何应对“雷暴哮喘”?
突破600元/克 黄金首饰价格上涨 销售火爆
中国彩妆行业市场分析:赛道景气度探底回升,国货彩妆品牌加速崛起
马苏才是“杨贵妃”的最佳人选,美过刘晓庆的“杨贵妃”!
2023广州暴雨停课最新消息(持续更新)
邯郸经开区莅临新乡经开区调研工商联(商会)建设情况
资金流向(9月7日)丨中芯国际、人民网、软通动力融资资金买入排名前三,中芯国际获买入近6亿元
今日澳元/美元汇率基本面行情分析(2023年9月8日)
走出人身险寒冬,中国人寿该往何处去?
第六届敦煌文博会签约金额106亿元
沉默有时念想有时谁诀别相思成疾莫问天涯是什么歌
东辉:修正似乎已经结束,黄金可能迎来进一步反弹!
打破交流壁垒 共享司法数据
重拾顶级防线,走向四强的美国队
新品涌现 多举措推动显示产业跃向价值链中高端
兰州市精神文明网络传播志愿服务队成立
突发!王楚钦遭重大打击,马龙很意外,刘国梁担心的事情发生了
漫评|共襄亚运盛会,科技国潮尽显“中式浪漫”
半年多过去了,ChatGPT 的排名快“垫底”了
港交所9月8日全日停市
江苏盐城:九龙口湿地生态美