Mengapa Kebanyakan Rangka Kerja AI Gagal Membantu Pengendali

Ilustrasi editorial tindanan rangka kerja AI yang tidak stabil dengan satu blok yang jatuh

Kenali James. Beliau menguruskan syarikat logistik 90 orang di Midwest. Hasil adalah kukuh. Ketua operasinya menyebut bulan lalu bahawa separuh daripada e-mel sokongan pelanggan mereka mungkin boleh dikendalikan oleh AI, dan idea itu terpegang. Beliau terus memfikirkannya. Berasa seperti beliau perlu melakukan sesuatu mengenainya, tetapi tidak dapat menamakannya.

Beliau melakukan apa yang dilakukan oleh mana-mana orang yang munasabah: beliau Google "rangka kerja transformasi AI." Tiga jam kemudian, beliau menutup kompribanya.

Apa yang dijumpainya adalah PDF McKinsey 47 halaman bertajuk "Mewayarkan Semula Organisasi untuk AI Generatif," sebuah artikel Harvard Business Review tentang "kematangan kesediaan AI," kuadran Gartner yang tidak mempunyai langganan untuk dibacanya, dan karusel LinkedIn yang mendakwa "5 P Kejayaan AI" (Potensi, Orang, Proses, Platform, Prestasi). Beliau tidak dapat menemui satu halaman pun yang menjawab soalan sebenarnya: alat AI mana yang harus dicuba oleh pasukan sokongannya dahulu, dan apa yang mungkin akan salah?

Ini adalah masalah pengendali. Dan inilah sebab kebanyakan rangka kerja AI gagal.

Empat jenis rangka kerja (dan sebab masing-masing kurang memuaskan)

Terdapat ratusan rangka kerja AI yang beredar sekarang. Mereka terbahagi kepada empat kategori kasar, masing-masing dengan mod kegagalannya sendiri.

Rangka kerja perundingan: dibina untuk bilik lembaga

McKinsey menerbitkan rangka kerja seperti "Steer-Scale-Institutionalize." BCG mempunyai "AI Transformation Roadmap" dan peraturan 10-20-70 yang terkenal (10% teknologi, 20% reka bentuk semula perniagaan, 70% orang dan budaya). Deloitte menghasilkan laporan "State of AI" terperinci dengan peringkat kematangan dan peta keupayaan.

Ini benar-benar berguna untuk CIO Fortune 500 dengan Roadmap transformasi tiga tahun dan belanjawan yang diukur dalam lapan angka. Rangka kerja itu mengandaikan Pusat Kecemerlangan AI yang berdedikasi, pejabat program berbilang tahun, pasukan pengurusan perubahan, dan lembaga pengarah yang bersabar menunggu empat suku tahun untuk isyarat ROI.

Untuk James dalam logistik, dengan 90 pekerja dan ketua operasinya yang ingin mencuba AI pada e-mel sokongan, rangka kerja BCG 10-20-70 memberitahunya bahawa 70% cabarannya adalah perubahan orang dan budaya. Itu mungkin benar. Ia tidak boleh dilaksanakan. Beliau tidak memerlukan program perubahan budaya. Beliau perlu mengetahui sama ada perlu mencuba Intercom Fin, Zendesk AI, atau sesuatu yang lain, dan apa yang kelihatan seperti mod kegagalan.

Rangka kerja perundingan juga ditulis pada tahap "keupayaan" dalam pengertian strategik, bukan keupayaan AI dalam pengertian operasi. Apabila McKinsey bercakap tentang "keupayaan GenAI," mereka bermaksud keupayaan organisasi untuk menggunakan AI generatif pada skala. Mereka tidak bercakap tentang perbezaan antara output Generate (draf e-mel) dan tindakan Execute (menghantar e-mel itu sebenarnya). Butiran itu tidak sesuai dalam slaid bilik lembaga.

Jadi rangka kerja perundingan adalah tepat tentang gambaran besar dan tidak berguna dalam perincian. Mereka menerangkan rupa transformasi apabila selesai. Mereka tidak membantu anda bermula.

Rangka kerja akademik: ketat, tetapi lambat

Rangka kerja akademik dari MIT Sloan, HBR, dan kumpulan penyelidikan lebih berhati-hati dengan bukti dan lebih jujur tentang ketidakpastian. Mereka juga biasanya dua hingga tiga tahun di belakang keadaan alat semasa, kerana semakan rakan sebaya mengambil masa. Rangka kerja akademik yang diterbitkan pada awal 2024 mungkin direka di sekitar keupayaan LLM era 2022: sebelum model kelas GPT-4 menjadi API komoditi, sebelum berbilang modal menjadi keperluan asas, sebelum pembahagian ramalan-generatif menjadi sesuatu yang dibicarakan oleh setiap vendor SaaS.

Rangka kerja akademik juga cenderung mengukur perkara yang sukar diterapkan dalam konteks perniagaan: "kapasiti penyerapan AI," "budaya pembelajaran organisasi," "pembangunan keupayaan dinamik." Ini adalah konsep nyata. Ia sukar untuk diterjemahkan ke dalam OKR suku tahunan.

Dan rangka kerja akademik mengandaikan anda akan duduk dengan bahan itu, menjalankan eksperimen, mengumpul data, berulang selama 18 bulan. Pengendali tidak mempunyai 18 bulan. Mereka mempunyai Demo vendor pada hari Khamis dan keputusan yang perlu dibuat menjelang Jumaat.

Rangka kerja vendor: peta produk yang disamarkan

Setiap syarikat perisian AI utama menerbitkan rangka kerjanya sendiri. Salesforce mempunyai "Prinsip AI Dipercayai." Microsoft mempunyai AI Transformation Playbook. SAP, Oracle, ServiceNow, dan HubSpot semuanya mempunyai satu. Google Cloud menerbitkan penilaian kesediaan AI.

Ini wujud untuk menjual produk. Itu bukan kritikan terhadap integriti mereka. Ia hanya kebenaran tentang struktur insentif. Apabila Salesforce menerangkan "empat tiang kesediaan AI," empat tiang itu dipetakan, tidak menghairankan, kepada produk Salesforce. Apabila rangka kerja AI Microsoft menekankan integrasi Microsoft 365 Copilot, itu bukan kebetulan.

Rangka kerja vendor adalah baik untuk satu perkara: memahami cara vendor berfikir tentang peranan produk mereka dalam tindanan AI anda. Tetapi mereka bukan peta objektif tentang apa sebenarnya AI perniagaan. Mereka adalah alat jualan yang berbentuk rangka kerja.

Tanda petunjuknya: rangka kerja vendor hampir tidak pernah menamakan pesaing. Rangka kerja yang baik harus memberitahu anda bila hendak menggunakan alat orang lain. Rangka kerja vendor tidak boleh melakukan itu.

Rangka kerja hype: 5 P Kekosongan AI

Kategori keempat sebenarnya bukan rangka kerja. Ia adalah format kandungan. Karusel LinkedIn, catatan surat berita, dan lakaran kecil YouTube menghasilkan aliran tanpa henti "rangka kerja AI" yang, apabila diperiksa, adalah klise perniagaan dengan "AI" ditambah.

"Model ADAPT untuk Kejayaan AI" (Nilaikan, Reka Bentuk, Gunakan, Rintis, Transformasikan). "6 C Kepimpinan AI" (Kejelasan, Konteks, Keingintahuan, Budaya, Keupayaan, Komitmen). Ini tidak salah, tepat. Mereka hanya tidak spesifik kepada AI. Anda boleh menggantikan "AI" dengan "transformasi digital" atau "agile" atau "awan" dan rangka kerja itu akan sama-sama terpakai, yang bermakna ia tidak menjelaskan apa-apa yang tersendiri.

Mod kegagalan rangka kerja hype adalah bertentangan dengan rangka kerja perundingan. Rangka kerja perundingan adalah tepat tetapi tidak boleh diakses. Rangka kerja hype boleh diakses tetapi kosong. Tidak satu pun yang memenuhi keperluan pengendali di mana mereka sebenarnya berada.

Apa yang sebenarnya diperlukan oleh pengendali

Orang yang menggunakan rangka kerja AI dalam perniagaan sebenar bukan CIO yang menguruskan program transformasi. Beliau adalah ketua operasi jualan yang cuba mencari tahu aliran kerja mana yang boleh dibantu oleh AI. Atau ketua kewangan di sebuah syarikat 60 orang yang tertanya-tanya sama ada AI boleh mempercepatkan penutupan bulan-akhir mereka. Atau James, yang cuba menjawab satu soalan: alat AI mana yang harus dicuba dahulu untuk sokongan pelanggan?

Inilah yang sebenarnya diperlukan oleh pengendali daripada rangka kerja. Ia adalah senarai yang pendek.

Perbendaharaan kata. Perkataan yang membolehkan mereka menerangkan apa yang dilakukan oleh alat AI dalam istilah yang sama yang mereka gunakan untuk menerangkan mana-mana alat perniagaan lain. Bukan "automasi pintar" atau "enterprise kognitif" tetapi kata kerja. Apa yang diambil oleh alat ini? Apa yang dihasilkannya? Apa yang berubah di dunia apabila ia berjalan? Perbendaharaan kata seperti lima keupayaan ACE membolehkan anda menerangkan mana-mana alat AI dalam istilah yang konsisten.

Bantuan keputusan. Bukan Roadmap 12 langkah. Satu soalan: berdasarkan apa yang ingin saya capai, keupayaan atau gabungan keupayaan mana yang diperlukan? Jika anda perlu mengklasifikasikan e-mel sokongan pelanggan, itulah Analyze. Jika anda perlu menghalanya secara automatik berdasarkan keutamaan, tambah Predict dan Execute. Itu adalah keputusan, bukan model kematangan.

Mod kegagalan yang jujur. Rangka kerja perundingan mendokumentasikan "risiko" dalam istilah abstrak ("cabaran pengurusan perubahan," "jurang tadbir urus data"). Pengendali memerlukan butiran. Jika anda menggunakan alat AI yang melaksanakan tindakan tanpa semakan manusia, apa yang biasanya salah? Apa yang kelihatan seperti andaian kesediaan data yang buruk apabila ia gagal? Sempadan Generate-ke-Execute adalah perbezaan antara draf e-mel dan satu yang dihantar. Itulah jenis mod kegagalan yang mengakhiri suku tahun seseorang.

Laluan yang tidak memerlukan perunding. Kebanyakan pengendali yang memerlukan rangka kerja ini tidak akan mengupah McKinsey. Mereka perlu pergi dari "saya ingin mencuba AI pada aliran kerja ini" ke "inilah cara saya menilai alat, menjalankan perintis, dan memutuskan apa seterusnya" tanpa penglibatan enam angka. Laluan itu harus boleh dipelajari daripada perpustakaan artikel, bukan terkunci di sebalik hubungan perundingan.

Di mana rangka kerja salah: empat kesilapan biasa

Kebanyakan rangka kerja, walaupun yang bertujuan baik, jatuh ke dalam perangkap yang boleh dijangka.

Terlalu abstrak. Rajah strategik yang menunjukkan peringkat kematangan AI atau perjalanan transformasi tidak memberitahu anda apa yang perlu dilakukan pada hari Isnin. Mereka tepat pada ketinggian 30,000 kaki dan tidak berguna di peringkat bawah. Rangka kerja mesti menghubungkan konsepsi dengan konkrit, dan kebanyakannya tidak.

Terlalu umum. AI penjagaan kesihatan bukan AI runcit bukan AI logistik. Jenis data berbeza, keperluan pematuhan berbeza, akibat kegagalan berbeza. Rangka kerja yang tidak mengakui perbezaan itu tidak salah, tetapi ia meninggalkan kerja yang sukar kepada pengendali: menterjemahkan prinsip umum ke dalam amalan khusus industri. Rangka kerja yang baik mempunyai asas neutral industri dan kemudian mendapat hak untuk menjadi khusus.

Terlalu khusus teknologi. Mana-mana rangka kerja yang dibina di sekitar "GPT-4" atau "ekosistem LangChain" atau "Stable Diffusion" akan sebahagiannya lapuk dalam 18 bulan. Evolusi AI perniagaan cukup pantas sehingga rangka kerja perlu berasas pada keupayaan dan corak yang bertahan lebih lama daripada mana-mana alat atau model tertentu. Kata kerja lebih tahan lama daripada nama produk.

Terlalu berorientasikan enterprise. Ini yang terbesar. Rangka kerja yang dibina untuk syarikat dengan CIO, pasukan data yang berdedikasi, dan Roadmap berbilang tahun tidak dipindahkan ke syarikat dengan 30 hingga 500 pekerja. PKS mempunyai kekangan yang berbeza: belanjawan yang lebih ketat, kedalaman teknikal yang kurang, kesediaan data yang lebih rendah, dan kitaran keputusan yang lebih pantas. Mereka tidak mampu perintis 6 bulan sebelum melihat nilai. Rangka kerja yang tidak menangani jurang ini bukan rangka kerja untuk kebanyakan perniagaan. Ia adalah rangka kerja untuk subset yang tidak memerlukan bantuan sebegini sangat.

Apa yang berfungsi dalam rangka kerja AI

Agar rangka kerja benar-benar melayan pengendali, ia memerlukan beberapa sifat yang kurang dimiliki oleh kebanyakan rangka kerja.

Perbendaharaan kata yang mudah. Lima hingga tujuh konsep, bukan lima puluh. Jika rangka kerja mempunyai lebih banyak istilah daripada yang boleh anda simpan dalam ingatan kerja semasa Demo vendor, ia tidak membantu anda pada saat yang paling penting.

Reka bentuk komposisi. Konsep-konsep harus bergabung menjadi apa sahaja. Jenis data bergabung dengan keupayaan. Keupayaan bergabung menjadi corak. Corak bergabung menjadi aliran kerja ejen. Rangka kerja yang boleh digabungkan adalah kit alatan, bukan peta tetap. Ia boleh menerangkan perkara yang belum wujud apabila rangka kerja ditulis.

Jujur tentang had. Rangka kerja yang mendakwa menyelesaikan segalanya tidak menyelesaikan apa-apa. Rangka kerja terbaik memberitahu anda dengan jelas apa yang tidak ditanganinya, supaya anda tahu bila perlu mencari tempat lain.

Asas neutral industri, aplikasi khusus industri. Perbendaharaan kata teras harus berfungsi dalam mana-mana perniagaan. Tetapi rangka kerja yang baik mendapat kepercayaan dengan sanggup mengatakan "dalam industri anda, inilah cara ini berlaku secara berbeza." Teras generik, contoh khusus.

Dikemas kini secara kerap. AI bergerak cukup pantas sehingga mana-mana rangka kerja yang diterbitkan pada 2023 mempunyai jurang pada 2026. Rangka kerja yang komited kepada semakan suku tahunan dan kawalan versi yang jujur lebih boleh dipercayai daripada yang membentangkan dirinya sebagai kebenaran kekal.

Cara Rangka Kerja ACE cuba melakukan dengan lebih baik

Rangka Kerja ACE dibina dengan mod kegagalan ini dalam fikiran. Inilah yang dicubanya untuk dilakukan secara berbeza.

Ia menggunakan lima keupayaan dan bukannya dua puluh tujuh: Ingest, Analyze, Predict, Generate, Execute. Setiap alat AI melakukan satu atau lebih daripada ini. Anda boleh membaca mana-mana kes guna AI dalam lima minit menggunakan perbendaharaan kata ini.

Ia boleh digabungkan. Lima keupayaan bergabung menjadi kira-kira sepuluh corak berulang (Pembantu RAG, Penilaian dan Penghalaan, Kecerdasan Mesyuarat, dan lain-lain). Corak bergabung menjadi Ejen AI peringkat peranan. Tindanan dibina, tetapi asasnya cukup kecil untuk diingati.

Ia menamakan produk sebenar dan mod kegagarannya. Bukan "vendor AI terkemuka" tetapi Gong, Intercom Fin, Salesforce Einstein, Stripe Radar. Bukan "risiko AI" tetapi kisah kegagalan tertentu: apa yang berlaku apabila anda menggunakan Execute tanpa gerbang semakan manusia, apa yang kualiti data yang buruk sebenarnya lakukan kepada penggunaan AI.

Ia dibina untuk pengendali pasaran pertengahan, bukan CIO Fortune 500. Contoh-contohnya berjalan pada skala syarikat 30 orang, 90 orang, 500 orang. Bantuan keputusan mengandaikan anda menilai alat SaaS, bukan membina model proprietari.

Ia komited kepada kemas kini yang kerap. AI berkembang. Rangka kerja juga harus begitu. Itu bermakna jujur apabila bahagian memerlukan semakan, bukan mempertahankan dakwaan yang lapuk kerana ia sudah dalam cetakan.

Di mana Rangka Kerja ACE mungkin juga gagal

Ini adalah bahagian yang kebanyakan rangka kerja langkau. Tetapi ia adalah bahagian yang menjadikan selebihnya dari apa yang kami katakan boleh dipercayai.

Ia baru dan belum terbukti. Rangka Kerja ACE diterbitkan pada 2026. Ia belum diuji pertempuran selama beberapa tahun. Firma perundingan yang kami kritik mempunyai dekad penglibatan pelanggan untuk memperhalusi pemikiran mereka. Kami mempunyai reka bentuk yang kukuh dan prinsip pertama yang jelas. Itu bukan perkara yang sama dengan pengesahan empirikal. Masa akan memberitahu bahagian mana yang bertahan.

Ia adalah perbendaharaan kata, bukan preskripsi. Jika anda mahukan seseorang memberitahu anda tepat-tepat tiga alat mana yang perlu dibeli dan mengikut urutan mana, Rangka Kerja ACE bukan itu. Ia memberikan anda model mental untuk menilai alat dan mereka bentuk aliran kerja. Anda masih perlu membuat keputusan. Jika anda mencari "lakukan X, Y, Z," anda akan memerlukan Playbook yang dibina di atas asas ini, bukan asasnya sendiri.

Keupayaan mungkin berpecah atau bergabung. Kami yakin tentang lima hari ini. Tetapi "Execute" mungkin perlu dibahagi apabila ejen autonomi menjadi lebih biasa — perbezaan antara menghantar e-mel dan menavigasi aliran kerja agentik berbilang langkah adalah nyata dan semakin meningkat. "Ingest" mungkin bergabung dengan "Analyze" dalam sistem di mana persepsi dan pemahaman berlaku dalam satu laluan model. Rangka kerja harus berkembang. Kami tidak mendakwa mempunyai jawapan muktamad.

Kami tidak dapat meliputi setiap industri. Logistik pasaran pertengahan, SaaS, penjagaan kesihatan, pembuatan, perkhidmatan profesional: setiap satunya mempunyai kekangan khusus yang mencukupi sehingga rangka kerja umum akan terlepas sesuatu yang penting. Kami akan menerbitkan artikel khusus industri, tetapi kami akan sentiasa separa. Pengendali dalam industri yang belum kami liputi perlu melakukan beberapa kerja terjemahan.

Ia masih kandungan. Membaca artikel rangka kerja tidak menjadikan anda lebih baik dalam penggunaan AI. Melakukan menjadikan anda lebih baik. Rangka Kerja ACE memberikan anda perbendaharaan kata untuk berfikir dengan lebih jelas tentang kerja. Tetapi kerja adalah kerja.

Hubungan yang betul dengan mana-mana rangka kerja

Rangka kerja adalah alat. Tukul tidak membina rumah. Rangka Kerja ACE juga tidak membina strategi AI. Tetapi tukang kayu yang tidak memahami apa itu tukul tidak boleh membina apa-apa.

Pengendali yang boleh menerangkan apa yang dilakukan oleh alat AI dari segi keupayaan, yang mengetahui perbezaan antara draf dan tindakan, yang boleh membaca tawaran vendor dan bertanya "keupayaan mana yang sebenarnya aktif di sini?" Pengendali itu membuat keputusan yang lebih baik daripada yang tidak boleh. Bukan kerana mereka membaca rangka kerja, tetapi kerana mereka mempunyai perbendaharaan kata untuk bertanya soalan yang betul.

Gunakan Rangka Kerja ACE apabila ia membantu anda bertanya soalan yang lebih baik. Letakkan ia apabila soalan itu adalah sesuatu yang tidak ditanganinya. Dan jika anda menemui tempat di mana ia tidak bertahan, kami ingin mengetahuinya.

Rangka Kerja ACE adalah dokumen yang hidup. Kritikan ini adalah sebahagian daripadanya.

The ACE Framework Foundation