天水建网站,关键词优化排名哪家好,网络搏彩网站做代理,餐饮品牌设计网站文章把用户使用社交媒体的原因归结为搜寻知识、找乐子和基础性任务等三种。 基于此#xff0c;把LLM应用在社交媒体的任务抽象为了#xff1a;
知识任务#xff1a;用户获取新信息、知识#xff0c;比如通过搜索帖子、询问其他用户。娱乐任务#xff1a;在社交媒体上获得…文章把用户使用社交媒体的原因归结为搜寻知识、找乐子和基础性任务等三种。 基于此把LLM应用在社交媒体的任务抽象为了
知识任务用户获取新信息、知识比如通过搜索帖子、询问其他用户。娱乐任务在社交媒体上获得娱乐积极参与。基础任务对社交网络进行管理和操作的日常任务。
当然挑战也有很多总结了三点 1.上面的三大任务现在的llm都没有训练过 2.社交媒体是动态实时的llm是静态的 3.llm输出内容的评估安全性等
最后分别针对这三个任务的三点挑战分别给出了解决方案 1.对于知识任务使用RAG检索与问题相关的社交媒体帖子和评论得益于RAG的扩展性和动态性解决了前两个问题。 针对LLM对一些错误的内容误导产生错误的回复采用了fine-tuing方式Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., et al. (2022). Training language models to follow instructions with human feedback. Advances in Neural Information Processing Systems, 35:27730–27744. 2.对于娱乐任务应用一个奖励模型预测用户的交互行为。同时使用周期性的奖励模型来应对第二个挑战。
源论文 https://arxiv.org/abs/2401.02575