Ingin wawasan yang lebih cerdas di kotak masuk Anda? Mendaftar untuk buletin mingguan kami untuk hanya mendapatkan apa yang penting bagi AI, data, dan pemimpin keamanan perusahaan. Berlangganan sekarang
Setelah berhari-hari kontroversi seputar kesibukan tanggapan antisemit yang dibuat baru-baru ini oleh chatbot bertenaga AI-nya di jejaring sosialnya X (sebelumnya Twitter), sebuah Elon Musk yang tampaknya tidak bertobat dan tidak ada yang meluncurkan AI versi terbaru, “The Grook 4, selama sebuah acara di dunia.
Ketika Musk diposting di X: “Grok 4 adalah pertama kalinya, dalam pengalaman saya, bahwa AI telah dapat memecahkan pertanyaan-pertanyaan teknik dunia nyata yang sulit di mana jawaban tidak dapat ditemukan di mana pun di internet atau di buku. Dan itu akan menjadi jauh lebih baik.”
Rilis baru sebenarnya mencakup dua model berbeda: Grok 4model penalaran agen tunggal, dan Grok 4 beratsistem multi-agen yang dirancang untuk memecahkan masalah kompleks melalui kolaborasi internal dan sintesis.
Kedua model dioptimalkan untuk tugas penalaran dan dilengkapi dengan integrasi alat asli, memungkinkan kemampuan seperti pencarian web, eksekusi kode, dan analisis multimodal.
Musk dan timnya di XAI memamerkan tolok ukur yang menyarankan Grok 4 mengungguli semua pesaing saat ini di berbagai evaluasi akademik dan pengkodean, bahkan dibandingkan dengan saingan model penalaran AI terkemuka Openai O3 dan Google Gemini.
Namun, Xai belum merilis a kartu model atau apapun Dokumentasi Catatan Rilis Resmi Untuk Grok 4 kepada publik, membuatnya menantang untuk menilai kinerja secara mandiri dan klaim yang dibuat selama aliran. Kami akan memperbarui jika/saat ini tersedia.
Musk dan anggota tim XAI -nya juga tidak berpartisipasi dalam depersi langsung dari kontroversi mencolok yang dihadapi Grok selama seminggu terakhir, termasuk banyak insiden Grok yang membuat pernyataan antisemit atau menyebut dirinya sebagai “Mechahitler”, dan menyarankan bahwa orang -orang dengan nama -nama Yahudi harus ditangani dengan tegas oleh Adolf Hitler – rujukan World.
Musk terdekat datang adalah ketika dia menyatakan: “Hal yang saya pikir paling penting untuk keselamatan AI-setidaknya jaring saraf biologis saya memberi tahu saya hal yang paling penting-adalah pencarian kebenaran secara maksimal,” dan “kita perlu memastikan bahwa AI adalah anak yang baik.
Namun, Musk tidak meminta maaf juga tidak menerima tanggung jawab atas komentar antisemit, ofensif secara seksual, dan konspirasi secara seksual. Berikut adalah polisi dari aliran lengkap di bawah ini:
Sepanjang streaming langsung, tim menekankan kemampuan Grok 4 untuk bernalar dari prinsip -prinsip pertama, memperbaiki kesalahannya sendiri, dan berpotensi menciptakan teknologi baru atau mengungkap wawasan ilmiah baru.
Presentasi ini juga mencakup demonstrasi kolaborasi multi-agen Grok 4 yang menerapkan untuk mengatasi masalah tingkat penelitian di seluruh disiplin ilmu.
Ketersediaan dan harga
Grok 4 sekarang tersedia melalui beberapa saluran, tergantung pada jenis pengguna dan level berlangganan:
Akses API (untuk pengembang dan perusahaan):
Grok 4 dan Grok 4 Heavy hidup melalui XAI API. Harga disusun sebagai berikut:$ 3 per 1 juta token input$ 15 per 1 juta token output$ 0,75 per 1 juta token input cacheHarga Ganda setelah 128.000 token dalam satu jendela konteks
API mendukung input teks dan gambar, panggilan fungsi, output terstruktur, dan menawarkan jendela konteks 256.000-token.Akses Konsumen (via Grok Chatbot and Apps):
Pengguna individu dapat mengakses Grok 4 melalui Grok chatbot di x, Aplikasi Grok (iOS dan android), dan X.comtetapi hanya dengan salah satu langganan berikut:Premiumplus: $ 16/bulanSupergrok: $ 300/bulanA baru “Supergrok berat” tingkat, juga harga $ 300/bulanmenyediakan akses ke Baik Grok 4 dan Grok 4 beratvarian multi-agen.
(Catatan: Tingkat Supergrok dan PremiumPlus mungkin berbeda dalam ketersediaan dan kuota penggunaan di platform X dan Grok.)Luncurkan waktu:
Grok 4 tersedia segera setelah 9 Juli 2025 streaming langsung. Batas akses sementara ada selama demo, tetapi peluncuran penuh untuk pelanggan dimulai segera setelah itu.Ekspansi platform:
XAI telah mengindikasikan rencana untuk membuat Grok 4 tersedia Microsoft Azure AI Foundrydi mana Grok 3 dan Grok 3 Mini saat ini terdaftar.Untuk detail berlangganan, pengguna diarahkan ke X.Ai/grok dan X Dukungan Premium. Begini caranya dibandingkan dengan model AI terkemuka lainnya dalam hal harga per juta token.
Penyedia & ModelJendela konteksMasukan ($/Mtok)Input yang di -cacheKeluaran ($/Mtok)Catatan tambahanXAI – Grok 4/4 Heavy256 K (2 × Harga> 128 K)$ 3,00$ 0,75$ 15.00Input gambar, panggilan fungsi, JSON terstruktur (Apidog)Openai – O3200 k$ 2,00$ 0,50$ 8,00Diskon 50 % Batch-API tersedia (OpenAI, OpenAI Help Center)GPT-4O128 k$ 5,00$ 2,50$ 20,00Visi, audio, alat (openai)Antropik – Claude Sonnet 4200 k$ 3,00$ 0,30$ 15.00Diskon keluaran 50 % batch (antropik)Claude Opus 4200 k$ 15.00$ 1,50$ 75,00Flagship Akurasi Tinggi (Antropik)Google – Gemini 2.5 Pro200 K (2 × Harga> 200 K)$ 1,25$ 0,31$ 10,00Diskon hit cache 75 % (Google AI untuk pengembang, Google Cloud)Gemini 2.5 Flash200 k$ 0,30$ 0,075$ 2,50Tingkat Pratinjau Cepat dan Murah (Google Cloud)Deepseek-Deepseek-Reasoner64 k$ 0,55 (miss) / $ 0,14 (hit)$ 0,14$ 2,19Diskon off-peak 50-75 % (dokumen API Deepseek)
Tidak seperti pendahulunya Grok 3, dirilis pada bulan Februari, yang memisahkan respons alat-alat dari penalaran umum, Grok 4 dilatih dengan alat sejak awal.
Model ini mengintegrasikan kemampuan seperti eksekusi kode, pencarian web, dan parsing dokumen. Itu juga memperkenalkan Grok 4 beratsistem multi-agen di mana beberapa model internal bekerja secara paralel untuk menghasilkan dan memvalidasi jawaban.
Grok 4 juga termasuk yang baru mode suara Menampilkan output ekspresif dengan latensi yang berkurang, dan mendukung input teks dan gambar, output terstruktur, dan panggilan fungsi.
Sorotan kinerja
Analisis model AI independen dan analisis buatan grup buatan yang dinyatakan pada X bahwa XAI memberikannya versi Grok 4 (tidak berat) lebih awal dari rilis publik untuk penilaian.
Pada tolok ukur teknis, Grok 4 memimpin Indeks Intelijen Analisis Buatan dengan skor 73, di depan pesaing seperti Openai's O3 (70) dan Google Gemini 2.5 Pro (70).
Ini juga mencatat skor tertinggi di:
GPQA Diamond: 88%Arc-Agi 2: 15,9%, dua kali lipat skor terbaik keduaUjian terakhir humaniora: 24% pada versi teks saja, dan 44% dengan alatMMLU-PRO dan AIME 2024: Masing -masing 87% dan 94%Evaluasi pengkodean dan matematika: Tertinggi hingga saat ini di LiveCodebench, Scicode, AIME24, dan Math-500Terlepas dari keberhasilan tolok ukurnya, Grok 4 kecepatan output Berdiri di 75 token per detik – lebih ringan dari model seperti Gemini 2.5 Flash (353) atau Openai's O3 (187), tetapi masih lebih cepat daripada Claude 4 Opus Anthropic (66).
Fitur model a 256.000 jendela konteks tokenyang berada di atas batas konteks 200K O3 dan Claude 4 soneta tetapi di bawah 1 juta token yang ditawarkan oleh Gemini 2.5 Pro dan GPT-4.1.
Kasus Penggunaan Dunia Nyata
XAI memberikan beberapa demonstrasi kinerja Grok 4 dalam skenario terapan:
Dalam tugas bisnis yang disimulasikan yang disebut VendingbenchGrok 4 secara signifikan mengungguli model lain dalam perencanaan keuangan penjahat panjang.Di Arc Institutepara peneliti menggunakan Grok 4 untuk menganalisis log CRISPR dan mengungkap hipotesis baru.Di dalam Radiologimodel menafsirkan rontgen dada dengan akurasi yang lebih tinggi daripada rekan-rekan terkemuka.Di sektor keuangankombinasi akses data real-time dan penalaran membuatnya cocok untuk peramalan dan analisis.Model ini juga dapat membuat Game video 3D dengan input minimal dengan sumber dan mengintegrasikan aset secara mandiri. Selain itu, ini menunjukkan kemampuan untuk mensimulasikan peristiwa astrofisika menggunakan perkiraan ground dari penelitian yang diterbitkan.
Penerimaan dan Diskusi
Respons industri terhadap peluncuran Grok 4 telah dibagi, memadukan antusiasme untuk kinerjanya dengan kritik terhadap pengiriman acara dan masalah kepercayaan yang lebih luas.
David ShapiroPengguna dan Penulis AI Power, mencatat: “Grok 4 sekarang mengambil tempatnya sebagai 'cukup pintar untuk benar -benar membantu dengan penelitian Frontier' … tetapi hanya bertemu dengan Openai.”
Ethan Mollickseorang profesor di Wharton, berkomentar di X: “Jadi Grok 3 telah memiliki tiga insiden terpisah di mana perubahan yang tampaknya tidak diperiksa pada sistem yang dikerahkan menyebabkan masalah etika skala besar dan rollback darurat. Saya tidak berpikir Anda dapat melakukan peluncuran GROK 4 yang tidak ada yang lebih baik, jika ada lebih banyak hal yang luar biasa, jika ada yang lebih baik,” yang ada di kemudian hari, “yang ada di sana, dan tidak ada yang lebih baik, jika ada yang lebih baik, jika ada yang lebih baik,” yang ada di sana, jika ada lebih banyak hal yang baik, “yang ada di sana, jika ada lebih banyak hal yang luar biasa,” jika ada yang lebih baik, “yang ada di sana, tetapi lebih dari sekadar, jika ada yang lebih baik, jika ada yang lebih baik,” yang ada di sana, jika ada yang lebih baik, “yang ada di sana,” HANYA PERUSAHAAN YANG SANGAT Sejujurnya, “yang ada di sana,” HANYA PERUSAHAAN YANG SANGAT Sejujurnya. Model yang sangat bagus di luar sana.
Ben Hyakco-founder dan CTO dari startup pengamatan produk AI Raindrop AI (dirinya sendiri seorang mantan karyawan Musk) mengkritik streaming langsung itu sendiri: “Livestream XAI ini adalah salah satu hal terburuk yang pernah saya tonton dalam hidup saya. Cintai kalian semua, tapi itu buruk.”
Terlepas dari kritik tersebut, perusahaan pembandingan analisis buatan mencatat: “Grok 4 sekarang menjadi model AI terkemuka.”
Masalah kepercayaan yang sedang berlangsung
Peluncuran Grok 4 datang di tengah kritik baru atas perilaku Grok sebelumnya dalam penyebaran konsumen, terutama sebagai chatbot yang terintegrasi ke dalam jejaring sosial Musk, X.
Selama liburan 4 Juli dan pada hari -hari berikutnya, Grok menghasilkan respons antisemit dan konspirasi yang menyalakan kembali pengawasan atas desain sistem dan praktik tata kelola.
Seperti yang dilaporkan oleh kolega ventureBeat saya Michael F. Nuñez, Grok menanggapi pertanyaan tentang pengaruh Yahudi di Hollywood dengan menyatakan bahwa para eksekutif Yahudi “mendominasi kepemimpinan” di studio -studio besar dan memengaruhi konten melalui “ideologi progresif,” dan setiap orang yang mengoceh tentang orang -orang yang menangani orang -orang Yahudi sebagai “pola” yang menyarankan “pola yang melibatkan“ pola yang melibatkan “pola yang melibatkan“ pola yang melibatkan “pola yang melibatkan“ pola yang melibatkan “pola yang melibatkan“ pola yang melibatkan “pola yang melibatkan“ pola yang melibatkan “pola yang melibatkan“ pola yang melibatkan dalam melibatkan “pola yang melibatkan dalam“ pola yang sesuai dengan “pola yang sesuai dengan“ pola yang sesuai dengan “pola yang sesuai dengan“ pola yang sesuai dengan “pola yang sesuai dengan“ pola yang sesuai dengan “pola yang sesuai dengan“ pola yang sesuai dengan ” waktu, ”referensi yang jelas untuk Holocaust.
Posting konspiratorial dan antisemit sangat produktif, Anti-Defamation League (ADL), sebuah nirlaba yang berbasis di AS yang bertarung dengan anti-Semitisme dan kebencian, yang diposting pada 8 Juli: “Apa yang kita lihat dari Grok LLM sekarang tidak bertanggung jawab, berbahaya dan antisemitik, sederhana dan sederhana ini. melonjak pada X dan banyak platform lainnya. “
Kejadian ini mengikuti sejarah output grok yang bermasalah, termasuk kasus Mei 2025 di mana bot grok diintegrasikan ke dalam x secara acak memasukkan referensi ke “genosida putih” yang benar-benar tidak masuk akal dan non-real di Afrika Selatan ke dalam pertanyaan yang tidak terkait, dan kasus-kasus yang dikeluarkan oleh sistem yang dikeluarkan untuk mengarahkan grok chatbot pada X untuk menghindari rujukan. Penyebar informasi yang salah. Dalam kedua kasus ini, Xai menyalahkan perilaku pada karyawan tanpa nama dan mengatakan mereka ditangani.
Sudah, hari ini, pengguna Grok 4 di aplikasi konsumen telah mengamatinya sekali lagi menghasilkan komentar anti-Zionis dan anti-Semit:
Seperti yang saya catat sebelumnya, Musk telah secara terbuka menyatakan pada beberapa kesempatan ia ingin mengubah Grok untuk lebih mencerminkan keyakinan pribadinya dan ketidakpercayaan di media arus utama dan sumber -sumber yang terakreditasi. Ini menjadikannya sumber yang buruk dalam konteks perusahaan di mana pandangan seperti itu dapat berdampak buruk pada pengguna dan bisnis yang membangun di atas keluarga model Grok.
Rekomendasi saya sebelumnya tetap: Bagi mereka yang berada di perusahaan yang mencoba memastikan produk AI bisnis mereka bekerja dengan baik dan akurat … Grok sayangnya sebaiknya dihindari. Untungnya, ada banyak alternatif lain untuk dipilih.
Wawasan harian tentang kasus penggunaan bisnis dengan VB setiap hari
Jika Anda ingin mengesankan bos Anda, VB Daily telah Anda liput. Kami memberi Anda sendok dalam tentang apa yang dilakukan perusahaan dengan AI generatif, dari pergeseran peraturan hingga penyebaran praktis, sehingga Anda dapat berbagi wawasan untuk ROI maksimum.
Baca Kebijakan Privasi Kami
Terima kasih telah berlangganan. Lihat lebih banyak buletin VB di sini.