Окремо Маск наголосив, що навіть «гола модель» (тобто без доступу до зовнішніх інструментів) показує значно кращий результат в Останньому Екзамені Людства — 27%, порівняно з 20–21% у o3 та Gemini 2.5 Pro. А з використанням інструментів результат перевищує 40%. Причому Маск зауважив, що ці інструменти — дуже примітивні. По суті, як і в інших моделей: інтернет-пошук, виконання коротких програм (створених самою моделлю) для вирішення задач — наприклад, для точних математичних розрахунків тощо.
І от тут Маск оголосив, що вони планують надати Grok потужні інструменти — ті самі, які використовуються в Tesla і SpaceX для інженерних розробок. За його словами, фізичні процеси там симулюють настільки точно, що коли результати експериментів відрізняються від результатів симуляції, спершу перевіряють, в чому помилка експерименту.
Це відкриває справді цікаву перспективу. Загалом чітко видно стратегічні фокуси команди Grok. Варто зазначити, що ці фокуси справді сильні й оригінальні. За всієї можливої антипатії до Маска, слід визнати: він уміє формулювати дуже потужну стратегію для своїх проєктів.