.7 Flash вышла. Можно запускать локально. На картинке ее метрики. Она думающая, к слову. Ждем цены на токены у поставщиков... Пишут, что модель будут дешево предлагать, сравнивая с конкурентами.
hf.co/unsloth/GLM-4.7-Flash-GGUF:Q2_K_XL вот эту запускал на xeon 2680v4 32gb через ollama
mtrnkwas
Скорость инференса какая в итоге получилась?
709864982
не очень быстро, а как посмотреть ? точно?
mtrnkwas
Если через Ollama, надо запускать с параметром verbose
Sergey_chto_nado
ссылка уже 404
709864982
Через гугл ищется
Null_Solid
на каком железе запускал? какая скорость получилась?
mike_kozyakov
Мне кажется, что китайцы с метриками нас, все же, обманывают:) или что-то недоговаривают…
mike_kozyakov
mike_kozyakov
Я не так как-то смотрю?
mike_kozyakov
709864982
709864982
достаточно быстро но глючит
mtrnkwas
Шустро. Особенно для CPU. А в чем глючная?
709864982
зацикливается часто
mtrnkwas
Попробовал вчера. На Beelink Mini PC GTR9 Pro AMD Ryzen AI Max+ 395 CPU 128GB RAM эта модель выдала 47 токенов в секунду. Было бы интересно попробовать версию GLM-4.7-Аir, если они ее выпустят.
Комментарии (18)