Bahasa Melayu

Analyze: Cara AI Memahami Apa yang Telah Anda Kumpulkan

Keupayaan Analyze — kanta pembesar mendedahkan corak dalam titik data

Kenali Lisa. Beliau menjalankan firma perundingan HR 140 orang. Perniagaan kukuh. Pasukan telah berkembang selama tiga tahun.

Tetapi musim bunga lepas, mereka membuat pertaruhan yang tidak menjadi. Mereka melanggan alat perekrutan AI yang menjanjikan "menapis calon dengan cerdas." Pasukan Lisa menjalankan pilot pada peranan penganalisis kanan yang terbuka. Lima ratus permohonan masuk. Alat memproses semuanya dalam masa kurang dari empat jam.

Kemudian Ketua Perekrutan beliau menyemak output. Empat puluh peratus calon yang ditandakan AI sebagai padanan yang kuat adalah jelas tidak sesuai. Seorang calon dengan enam tahun pengalaman yang relevan ditandakan keutamaan rendah kerana alat tidak mengenali konvensyen tajuk kerja alternatif yang biasa di Australia. Dua calon dengan hampir tiada pengalaman yang relevan ditandakan tinggi kerana mereka telah mengoptimumkan resume dengan kata kunci yang betul.

AI tidak rosak. Keupayaan Analyze hanya digunakan dengan cara yang tidak ada sesiapa yang benar-benar fikirkan, dan mod kegagalan tidak kelihatan sehingga ia menjadi mahal.

Artikel ini adalah untuk Lisa, dan untuk mana-mana pemimpin yang cuba memahami apa yang dilakukan Analyze, di mana ia berfungsi, di mana ia gagal, dan cara mempertanggungjawabkannya.


Apa yang sebenarnya dilakukan Analyze

Dalam Rangka Kerja ACE, Analyze adalah yang kedua daripada lima keupayaan teras: Ingest, Analyze, Predict, Generate, Execute. Jika Ingest mengambil data masuk, Analyze memahaminya.

Analyze mengambil maklumat yang telah diingesti dan menjawab soalan apakah ini? Ia mengklasifikasikan. Ia mengekstrak. Ia meringkaskan. Ia menterjemahkan. Ia mengenal pasti siapa yang berkata apa, bagaimana mereka merasainya, dan apa yang mereka mahu.

Predict menjawab soalan yang berbeza: apa yang akan berlaku? Analyze berorientasi kepada masa kini dan lalu. Ia mentafsir keadaan semasa: e-mel ini adalah aduan, kontrak ini mengandungi klausa pembayaran 90 hari, pelanggan ini kecewa. Predict mengambil tafsiran tersebut selangkah lebih jauh dengan meramalkan apa yang mungkin berlaku seterusnya.

Carian adalah berbeza lagi. Carian mengembalikan dokumen. Analyze mengembalikan makna. Apabila anda meminta pangkalan pengetahuan "cari saya kontrak tentang terma pembayaran," itu adalah Carian. Apabila anda meminta ia "ringkaskan apakah terma pembayaran biasa kami merentasi 50 kontrak terakhir," itu adalah Analyze (digabungkan dengan Generate untuk output).

Perbezaan ini penting kerana banyak alat AI mengaburkan ketiga-tiganya. Mengetahui keupayaan mana yang sebenarnya anda gunakan memberitahu anda mod kegagalan apa yang perlu dijangka dan input apa yang anda perlukan.


Enam sub-keupayaan Analyze

Analyze adalah yang paling luas daripada lima keupayaan ACE. Ia merangkumi enam operasi berbeza yang sering berfungsi bersama tetapi juga boleh gagal secara bebas.

1. Pengelasan

Pengelasan adalah operasi Analyze yang paling asas: meletakkan sesuatu ke dalam kategori. Adakah e-mel ini mendesak atau rutin? Adakah prospek ini layak atau tidak? Adakah tiket sokongan ini soalan pengebilan, laporan pepijat, atau permintaan ciri?

Pengelas menetapkan label. Ia boleh menjadi binari (ya/tidak), berbilang kelas (yang mana daripada sepuluh kategori?), atau berbilang label (semua kategori yang berkaitan daripada satu set). Kualiti pengelasan bergantung sepenuhnya pada kualiti dan relevan data latihan yang dipelajari model.

Di sinilah alat perekrutan Lisa tersandung. Pengelas telah dilatih pada data resume yang tidak digeneralisasi dengan baik merentasi konvensyen tajuk kerja serantau. Ia melabel calon dengan betul dalam taburan data latihannya, dan salah di mana sahaja di luarnya.

2. Pengekstrakan

Pengekstrakan menarik fakta khusus daripada teks tidak berstruktur. Diberi kontrak vendor, ekstrak terma pembayaran, had liabiliti, dan syarat pembaharuan. Diberi resume, ekstrak tahun pengalaman setiap kemahiran, majikan terkini, kelayakan pendidikan. Diberi tiket sokongan, ekstrak versi produk dan kod ralat.

Teks mentah masuk; medan berstruktur keluar. Alat seperti spaCy, Hugging Face transformers, dan OpenAI serta Anthropic API semuanya mempunyai keupayaan pengekstrakan yang kukuh. Di mana pengekstrakan gagal adalah di sempadan kesamaran: mengekstrak "John" daripada dokumen tanpa mengetahui John yang mana, atau menarik tarikh yang boleh merujuk kepada beberapa peristiwa.

3. Ringkasan

Ringkasan memadatkan kandungan panjang kepada poin-poin utama. RFP 60 halaman menjadi dua perenggan. Panggilan jualan 90 minit menjadi lima item tindakan dan tiga bantahan. Kaji selidik 5,000 respons menjadi satu dozen tema.

Ringkasan yang baik lebih sukar daripada yang kelihatan. Model mesti memutuskan apa yang penting, yang memerlukan pemahaman konteks dan niat. Ringkasan kontrak undang-undang untuk perolehan kelihatan berbeza daripada ringkasan untuk pematuhan. Alat yang tidak membenarkan anda menentukan khalayak menghasilkan ringkasan generik yang terlepas apa yang sebenarnya penting.

Gong dan Chorus (kini sebahagian daripada ZoomInfo) melakukan ringkasan pada panggilan jualan sebagai produk utama mereka. Snowflake Cortex termasuk ringkasan untuk pertanyaan data berstruktur.

4. Terjemahan

Terjemahan dalam Rangka Kerja ACE adalah lebih luas daripada terjemahan bahasa. Ia juga merangkumi terjemahan format: kod kepada dokumentasi, data kepada naratif, suara kepada teks.

Terjemahan bahasa (Inggeris ke Sepanyol, Jepun ke Perancis) kini adalah gred komoditi dalam AI. Yang lebih sukar adalah terjemahan domain: menukar jargon teknikal kepada bahasa biasa yang boleh ditindaklanjuti oleh eksekutif, atau menterjemahkan maklum balas pelanggan kepada keperluan produk berstruktur. Jenis terjemahan tersebut masih sangat sensitif kepada konteks dan framing.

5. Pengesanan sentimen dan niat

Pengesanan sentimen menjawab: bagaimana perasaan orang yang menulis ini? Positif, negatif, neutral, atau lebih terperinci: kecewa, berpuas hati, keliru. Pengesanan niat bertanya: apa yang ingin dicapai orang ini?

Kedua-dua ini sering dipasangkan tetapi tidak seharusnya dikelirukan. Pelanggan yang menulis "Saya tidak percaya anda akhirnya mengeluarkan ciri ini, telah menunggu bertahun-tahun" mempunyai sentimen positif tetapi sedang menyuarakan aduan. Pengesanan niat menanda ini sebagai mesej penggunaan ciri, bukan permintaan sokongan.

Analisis sentimen dan niat adalah yang membolehkan Zendesk AI menghalakan pelanggan yang marah kepada ejen kanan, atau membolehkan Intercom Fin membezakan antara pelanggan yang memerlukan bantuan dan pelanggan yang hampir Churn.

6. Pengecaman entiti dan topik

Pengecaman entiti mengenal pasti dan mengkategorikan perkara bernama dalam teks: orang, organisasi, tarikh, produk, lokasi, mata wang, jumlah kontrak. Pengecaman topik mengenal pasti apa yang sesuatu teks tentang tanpa bergantung pada entiti bernama.

Pengecam entiti membaca "Pada 4 Mac, Acme Corp menandatangani perjanjian $240,000 untuk perkhidmatan perisian" dan mengekstrak: tarikh (4 Mac), organisasi (Acme Corp), jumlah ($240,000), jenis (perkhidmatan perisian). Model topik membaca korpus tiket sokongan dan mengenal pasti kluster ("akses akaun," "percanggahan pengebilan," "permintaan ciri," "isu prestasi") tanpa sesiapa pun melabelkannya terlebih dahulu.

Kedua-dua adalah asas untuk menjadikan jumlah besar data tidak berstruktur boleh dilayari pada skala.


Enam contoh perniagaan sebenar

Setiap aliran kerja di bawah menanda sub-keupayaan utama yang sedang bekerja.

Triaj peti masuk [pengelasan + niat]: Lapisan Analyze (melalui OpenAI API) mengklasifikasikan 500 e-mel masuk sehari sebagai "respons diperlukan hari ini," "FYI sahaja," atau "tiada balasan diperlukan," dan menanda niat dalam kategori pertama. Masa tindak balas pada mesej keutamaan menurun sebanyak 60%.

Penghalaan tiket sokongan [pengelasan + pengekstrakan]: Lapisan Zendesk AI menanda setiap tiket mengikut jenis isu dan mengekstrak versi produk dan tahap akaun. Tiket dihalakan secara automatik, dan kadar pencapaian SLA perusahaan meningkat dari 71% kepada 94%.

Analisis panggilan jualan [ringkasan + sentimen]: Menggunakan Gong atau Chorus, setiap panggilan yang direkodkan menghasilkan ringkasan, tiga bantahan teratas yang dibangkitkan, lengkok sentimen prospek, dan produk pesaing yang disebut. Perbualan bimbingan menjadi khusus bukan generik.

Sintesis kaji selidik [pengecaman topik + ringkasan]: 5,000 respons kaji selidik teks bebas, diproses melalui pemodelan topik Hugging Face atau API kelas GPT, menghasilkan 12 tema dengan petikan yang mewakili dan pecahan sentimen dalam kira-kira empat jam. Tanpa AI, dua orang menghabiskan seminggu untuk kerja yang sama.

Penapisan resume [pengekstrakan + pengelasan]: Firma Lisa, selepas pilot, menggunakan Analyze untuk pengekstrakan sahaja: menarik tahun pengalaman setiap kemahiran, peranan terkini, dan kelayakan ke dalam medan berstruktur. Perekrut menapis dan menyusun medan tersebut sendiri. Ketepatan bertambah baik, dan masalah "tajuk kerja alternatif" hilang kerana perekrut kini melihat data asas bukan skor kotak hitam.

Analisis maklum balas pelanggan [sentimen + pengecaman entiti]: Saluran paip Analyze pada Anthropic API mengekstrak ciri produk yang disebutkan, menetapkan sentimen setiap ciri, dan menghasilkan senarai berperingkat tentang apa yang dipuji dan dikritik pelanggan. Pasukan produk mendapat input yang boleh ditindaklanjuti dalam masa kurang daripada sehari berbanding menunggu analisis manual suku tahunan.


Analyze vs. Predict: perbezaan yang penting

Ini adalah kekeliruan yang paling mahal. Banyak produk AI menggambarkan diri mereka sebagai "menganalisis" data apabila sebenarnya melakukan ramalan. Perbezaan dalam Rangka Kerja ACE adalah orientasi masa.

Analyze mentafsir masa kini. E-mel ini adalah aduan pengebilan. Panggilan ini mempunyai tiga bantahan. Pelanggan ini mempunyai sentimen negatif. Pernyataan ini menggambarkan apa yang ada, berdasarkan data yang anda miliki.

Predict meramalkan masa depan. Pelanggan ini 73% kemungkinan untuk Churn suku tahun depan. Prospek ini mempunyai kebarangkalian 82% untuk ditutup. Transaksi ini mempunyai peluang 99.4% untuk menjadi penipuan. Pernyataan ini meunjur ke hadapan berdasarkan corak sejarah.

Mod kegagalan juga berbeza. Analyze gagal apabila kategori salah, data latihan lapuk, atau konteks tidak jelas. Predict gagal apabila corak sejarah berhenti mencerminkan realiti semasa.

Alat pemarkahan prospek yang berkata "prospek ini adalah padanan yang baik" melakukan Analyze (skor padanan berdasarkan atribut semasa). Alat pemarkahan prospek yang berkata "prospek ini 78% kemungkinan untuk ditutup dalam S2" melakukan Predict. Kedua-duanya berguna. Kedua-duanya gagal secara berbeza. Mengetahui yang mana anda miliki memberitahu anda masalah mana yang perlu diawasi.


Analyze vs. Carian: dua kerja yang berbeza

Carian mengembalikan dokumen. Analyze mengembalikan makna. Cari "aduan pelanggan tentang pengebilan" dan anda mendapat dokumen. Minta Analyze untuk "ringkaskan apa yang pelanggan telah adukan dalam tiket berkaitan pengebilan sepanjang enam bulan lepas" dan anda mendapat tema, kekerapan, petikan yang mewakili, dan corak sentimen.

Kebanyakan aliran kerja AI sebenar menggabungkan kedua-duanya: dapatkan semula (Ingest + carian) untuk mendapatkan dokumen yang relevan, kemudian Analyze untuk memahami apa yang diambil, kemudian Generate untuk menghasilkan respons atau laporan. Kombinasi ini adalah corak RAG (Retrieval-Augmented Generation), dan Analyze adalah langkah tengah yang membuatnya berfungsi.


Alat biasa untuk Analyze

Kes penggunaan Alat
Pengelasan teks, pengekstrakan, sentimen OpenAI API, Anthropic API, Hugging Face Transformers
NLP dan pengecaman entiti spaCy, Hugging Face, AWS Comprehend
Analisis panggilan jualan Gong, Chorus (ZoomInfo), Fireflies
Analisis data berstruktur Snowflake Cortex, DuckDB, Google BigQuery ML
Pengelasan sokongan pelanggan Zendesk AI, Intercom Fin, Freshdesk Freddy

Kebanyakan syarikat pasaran pertengahan tidak membina keupayaan Analyze dari awal. Mereka membelinya dalam platform (Gong untuk panggilan jualan, Zendesk untuk sokongan) atau menggunakannya melalui API (OpenAI, Anthropic) untuk membina aliran kerja tersuai. Laluan API memberi lebih kawalan; laluan terikat dihantar lebih cepat.


Cara Analyze berhubung dengan keupayaan ACE yang lain

Analyze hampir selalu menjadi lapisan tengah dalam aliran kerja yang lebih besar.

Ingest menyuap Analyze. Rakaman panggilan menjadi transkrip (Ingest), dan Analyze mendedahkan bantahan dan sentimen. Ingest menukar isyarat mentah kepada bentuk yang boleh digunakan Analyze.

Analyze menyuap Predict. Ramalan memerlukan input berstruktur yang boleh dipadankan model terhadap hasil sejarah. Analyze mencipta ciri tersebut dengan mengklasifikasikan jawatan prospek, mengekstrak saiz syarikat mereka, dan menanda produk yang mereka sebutkan.

Analyze menyuap Generate. Anda tidak boleh menulis respons yang baik kepada aduan pelanggan tanpa terlebih dahulu memahami aduan. Analyze membaca tiket, mengenal pasti jenis isu dan sentimen, dan memberi Generate konteks yang diperlukan.

Rantaian Ingest → Analyze → Generate adalah salah satu corak yang paling biasa dalam AI perniagaan. Alat perisikan mesyuarat (Gong, Fireflies) mengikutinya dengan tepat: ambil panggilan (Ingest), fahami apa yang berlaku (Analyze), hasilkan ringkasan dan tindak lanjut (Generate).


Mod kegagalan

Analyze boleh dipercayai dalam keadaan terkawal dan mengejutkan rapuh apabila keadaan berubah. Ini adalah empat mod kegagalan yang paling kerap muncul.

Hanyutan label. Pengelas yang dilatih pada tiket sokongan tahun lepas berprestasi baik pada tiket sokongan tahun lepas. Apabila produk, pelanggan, atau jenis masalah yang mereka laporkan berubah, kategori pengelas berhenti sesuai dengan data baharu. Ini boleh berlaku secara perlahan (kemerosotan beransur-ansur) atau secara tiba-tiba (pelancaran produk mencipta jenis tiket yang tidak pernah dilihat model). Pembetulannya adalah memantau ketepatan dari masa ke masa dan melatih semula secara tetap.

Berat sebelah yang diwarisi. Pengelas belajar daripada data latihan. Jika data tersebut mencerminkan keputusan manusia sejarah, dan keputusan tersebut berat sebelah (dalam perekrutan, dalam kelulusan pinjaman, dalam keutamaan sokongan), pengelas menghasilkan semula berat sebelah tersebut pada skala. AI tidak menambah berat sebelah dari tiada; ia memperkuat corak yang sudah ada dalam data. Ini adalah mod kegagalan dalam penapisan resume berkuasa AI: pengelas yang dilatih pada data pengambilan sejarah sering merendahkan calon daripada kumpulan yang kurang diwakili.

Kes tepi yang terlalu yakin. Kebanyakan pengelas mengeluarkan skor keyakinan. Tetapi pengelas sering menunjukkan keyakinan tinggi pada input yang sebenarnya adalah kes tepi — keputusan rapat yang tidak pernah dilihat model sebelumnya. Skor keyakinan kelihatan meyakinkan. Pengelasan adalah salah. Pemeriksaan tempat manusia pada pengelasan berisiko tinggi adalah satu-satunya cara untuk menangkap ini.

Pengekstrakan buta konteks. Pengekstrakan menarik entiti bernama daripada teks, tetapi nama tidak membawa konteks bersamanya. "John menandatangani perjanjian" (John yang mana?), "Kontrak tamat tempoh dalam 90 hari" — dari bila? Pengekstrak mengeluarkan teks literal yang ditemui tanpa menyelesaikan kesamaran. Dalam dokumen dengan berbilang pihak, tarikh, dan rujukan, pengekstrakan buta konteks mencipta data berstruktur dengan jurang yang kelihatan lengkap tetapi tidak.


Cara mengukur kualiti Analyze

Analyze lebih boleh diukur daripada kebanyakan keupayaan AI kerana ia menghasilkan output berlabel yang boleh anda bandingkan dengan kebenaran tanah.

Ketepatan dan ingatan semula. Bina set ujian berlabel: sampel input yang telah anda kelaskan dengan betul secara manual. Ketepatan memberitahu anda berapa bahagian pengelasan positif model yang sebenarnya positif. Ingatan semula memberitahu anda berapa bahagian positif sebenar yang ditangkap model. Pengelas yang baik mempunyai kedua-duanya di atas 80%; cemerlang adalah di atas 90%.

Pemeriksaan tempat manusia 5%. Sampel kira-kira 5% output Analyze dan minta manusia menyemaknya. Ini menangkap hanyutan sebelum ia muncul dalam metrik agregat dan membina pengetahuan institusi tentang bagaimana model gagal, bukan hanya bahawa ia gagal.

Pengesanan hanyutan. Jalankan semula set ujian anda setiap 30 hingga 90 hari. Jika ketepatan dan ingatan semula menurun, taburan data telah berubah dan model memerlukan latihan semula. Alat perekrutan yang digunakan Lisa mungkin telah merosot selama berbulan-bulan sebelum sesiapa menyemak output dengan cukup teliti untuk menyedari.


Mengapa Analyze adalah kuda beban

Hubungi vendor AI hari ini dan tanya apa yang dilakukan produk mereka. Walau apa pun nama ciri, kerja asas mungkin Analyze. Penghalaan. Penandaan. Ringkasan. Pengekstrakan. Pemarkahan.

Daripada lima keupayaan ACE, Analyze muncul dalam rangkaian terluas aliran kerja perniagaan. Ia adalah lapisan tafsiran yang menukar data mentah kepada sesuatu yang boleh ditindaklanjuti manusia atau sistem lain. Tanpanya, Ingest hanya terkumpul, Predict tidak mempunyai apa untuk dipadankan corak, dan Generate tidak mempunyai konteks untuk bekerja.

Ia juga keupayaan yang paling senyap. Apabila ia berfungsi, pengguna tidak perasan. E-mel tiba sudah disusun. Tiket dihalakan dengan betul. Panggilan menghasilkan ringkasan yang tepat. Kerja tidak kelihatan sehingga ia gagal. Dan apabila ia gagal, kegagalan biasanya dipersalahkan kepada "AI itu salah" bukan kepada hanyutan label, berat sebelah yang diwarisi, atau pengekstrakan buta konteks.

Mengetahui perbezaan tersebut memberitahu anda soalan apa yang perlu ditanya sebelum anda membeli, metrik mana yang perlu dipantau selepas anda menggunakan, dan kegagalan mana yang perlu dijangkakan apabila keadaan berubah.


Apa yang perlu dibaca seterusnya