Chu (trf)

Chu

这人却很难

2 Followers

Recent casts

David Hockney RWA "Paper Pool" drops in under 24 hours

  • 0 replies
  • 0 recasts
  • 0 reactions

OpenAI 还是有排面,生态支持的都很好。发布前 NVIDIA、vllm、ollama 等等都适配好了。 20b 版本本地特别快,5090 bs=1 有 250 t/s,3090 都有90t/s。

  • 0 replies
  • 0 recasts
  • 0 reactions

Just painted some pixels on Monad Lisa! 🎨✨ Check out this collaborative pixel art canvas onchain.

  • 0 replies
  • 0 recasts
  • 0 reactions

Top casts

开始尝试做个微信公众号。定位: 1. 大模型及相关领域原创文章,同步博客、Twitter。 2. 分享一些学习资料或简短的知识点/短视频。 欢迎大家关注!

  • 0 replies
  • 0 recasts
  • 0 reactions

Long context 可以解锁 Many-shots,也就是放大量的示例到 Prompt 中,从某种意义上来说,效果和 SFT 相同。 然后使用 Context cache,价格和速度都可以接受。 测试在某个结构化知识图谱抽取任务上,只是将example数量从3增加到13(大约1w字符),F1就提升了6个点。

  • 0 replies
  • 0 recasts
  • 0 reactions

Minimax的模型我原本以为只是一个就很随大流的模型。但实际测试发现在长文本输出层面有点惊艳。 具体可以下载海螺AI,随便找一篇长的英文论文,让他逐字翻译并输出为Markdown格式。Kimi 会拒绝翻译长论文,但是Minimax的模型可以持续输出很久(实测输出1w tokens还不停)同时还可以输出论文插图。

  • 0 replies
  • 0 recasts
  • 0 reactions

Onchain profile

Ethereum addresses