“怎么了?”
从上车起就皱着眉头。
薛意眨了眨眼,单手碰碰眉心,好像这才意识到:哦。我在想一个问题。
什么问题?曲悠悠耳朵竖起来了。
Transformer架构里attention机制的数学本质,能不能用微分几何的框架重新表达。
陶予之昨晚给我看了一篇新的预印本,我觉得他们的证明路径有一个gap。
……
曲悠悠傻了。
“啊?”
这啥?
内容未完,下一页继续阅读