Chu (trf)

Chu

这人却很难

2 Followers

Recent casts

Top casts

开始尝试做个微信公众号。定位: 1. 大模型及相关领域原创文章,同步博客、Twitter。 2. 分享一些学习资料或简短的知识点/短视频。 欢迎大家关注!

  • 0 replies
  • 0 recasts
  • 0 reactions

Long context 可以解锁 Many-shots,也就是放大量的示例到 Prompt 中,从某种意义上来说,效果和 SFT 相同。 然后使用 Context cache,价格和速度都可以接受。 测试在某个结构化知识图谱抽取任务上,只是将example数量从3增加到13(大约1w字符),F1就提升了6个点。

  • 0 replies
  • 0 recasts
  • 0 reactions

Minimax的模型我原本以为只是一个就很随大流的模型。但实际测试发现在长文本输出层面有点惊艳。 具体可以下载海螺AI,随便找一篇长的英文论文,让他逐字翻译并输出为Markdown格式。Kimi 会拒绝翻译长论文,但是Minimax的模型可以持续输出很久(实测输出1w tokens还不停)同时还可以输出论文插图。

  • 0 replies
  • 0 recasts
  • 0 reactions

Onchain profile

Ethereum addresses