Predict: Cara AI Meramal Hasil Perniagaan

Keupayaan Predict — bar menaik dan sasaran retikel mewakili ramalan

Kenali Daniel. Beliau menguruskan syarikat pengedaran 65 orang (bekalan industri, pasaran serantau, kira-kira $18 juta dalam hasil tahunan). Perniagaan berjalan lancar. Pertumbuhannya sekitar 12% setahun selama tiga tahun terakhir.

Enam bulan lalu, pengurus jualan beliau mencadangkan alat penilaian prospek: "AI memberitahu wakil siapa yang perlu dihubungi. Tidak perlu meneka lagi." Daniel meluluskannya. Proses Onboarding mengambil masa dua minggu.

Tiga bulan kemudian, wakil-wakil beliau memanggilnya "peneka." Skor tidak sepadan dengan intuisi sesiapa pun. Pesaing yang telah mereka kejar selama dua tahun terus muncul sebagai keutamaan rendah. Akaun yang telah ditutup dua tahun lalu terus muncul sebagai panas. Wakil berhenti menggunakan skor itu. Pengurus jualan berhenti menyebutnya.

Daniel tidak memecat vendor. Beliau hanya tidak memperbaharui kontrak.

Model itu tidak rosak. Labelnya yang rosak.

Artikel ini untuk Daniel, dan untuk setiap pengasas atau ketua jualan yang pernah membeli alat AI ramalan dan mendapati outputnya terasa rawak. Masalahnya hampir tidak pernah algoritmanya. Ia adalah apa yang dimasukkan.

Apa yang sebenarnya dilakukan oleh Predict

Dalam Rangka Kerja ACE, Predict menggunakan data sejarah untuk menghasilkan pernyataan kebarangkalian tentang masa depan, atau tentang perkara yang tidak diketahui. Ia menjawab: apa yang mungkin?

Perkataan kuncinya ialah "kebarangkalian." Predict tidak pernah memberitahu anda apa yang akan berlaku. Ia memberitahu anda pengagihan hasil berdasarkan apa yang diketahuinya. Skor prospek 87% bermakna bahawa secara sejarah, akaun dengan profil ini ditukar pada kadar lebih kurang itu. Jika data sejarah anda salah, kebarangkaliannya juga salah.

Predict berfungsi pada tiga jenis input: data sejarah berstruktur (rekod CRM, sejarah transaksi, firmografi), data siri masa (hasil mengikut bulan, bacaan sensor), dan semakin banyak isyarat teks seperti transkrip panggilan dan bahasa tiket, yang diekstrak melalui Analyze dan dimasukkan sebagai ciri berstruktur.

Outputnya adalah skor kebarangkalian, nilai yang diramalkan, senarai berperingkat, anomali yang ditandakan, atau tindakan seterusnya yang disyorkan.

5 sub-keupayaan Predict

Predict bukan satu entiti. Terdapat lima perkara berbeza yang dilakukannya, dan setiap satu memerlukan data berbeza, model berbeza, dan komitmen organisasi berbeza untuk dikekalkan.

Penilaian (Scoring)

Berikan kebarangkalian kepada hasil tertentu. Skor prospek, skor risiko Churn, skor risiko kredit. Model melihat input (tingkah laku, firmografi, sejarah urusan) dan menghasilkan satu nombor yang mewakili kemungkinan. HubSpot Predictive Lead Scoring memberikan setiap kenalan peratusan kemungkinan-untuk-tutup berdasarkan sejarah penglibatan. Gainsight PX menghasilkan skor kesihatan setiap akaun, menggabungkan penggunaan produk, jumlah sokongan, dan trend NPS.

Input mesti dilabelkan secara sejarah. Jika CRM anda tidak mempunyai hasil "menang" dan "kalah" yang jelas dilampirkan kepada urusan lalu, model penilaian tidak mempunyai apa untuk dipelajari.

Ramalan (Forecasting)

Projeksikan nilai masa depan dalam tempoh masa tertentu. Ramalan hasil, ramalan permintaan, perancangan inventori. Model mempelajari corak dalam data siri masa sejarah dan memanjangkannya ke hadapan. Salesforce Einstein Forecasting meramalkan hasil tutup-menang setiap wakil setiap suku tahun, disesuaikan dengan umur Pipeline dan kelajuan urusan. Prophet (sumber terbuka, dibangunkan oleh Meta) membina keluk permintaan yang memenuhi musim untuk pasukan perancangan inventori dan permintaan.

Ramalan memerlukan sejarah siri masa yang cukup untuk menangkap musim. Kurang daripada 12 bulan biasanya tidak mencukupi untuk apa-apa yang bersifat musiman.

Kedudukan (Ranking)

Susun set item mengikut nilai jangkaan tanpa memberikan kebarangkalian tepat kepada setiap satu. "10 akaun teratas untuk dihubungi minggu ini." Kedudukan sering lebih berguna daripada penilaian dalam amalan. Wakil tidak perlu mengetahui kebarangkaliannya; mereka perlu mengetahui siapa yang perlu dihubungi dahulu. Kecerdasan Pipeline Clari menyusun urusan terbuka mengikut kemungkinan tutup. Penentuan keutamaan tiket AI Zendesk menyusun tiket masuk mengikut keterdesakan dan peringkat pelanggan.

Kedudukan lebih toleran daripada penilaian anggaran titik. Anda tidak perlu mengetahui sama ada akaun mempunyai peluang 74% atau 71% untuk tutup. Anda perlu mengetahui ia harus berada di atas akaun 48%.

Pengesanan anomali

Tandakan perkara yang menyimpang daripada garis asas statistik. Pengesanan penipuan. Pemantauan masa aktif. Pelanggaran polisi perbelanjaan. Amaran awal Churn. Stripe Radar menilai setiap transaksi terhadap garis asas penipuannya, menandakan 0.3% transaksi untuk semakan manusia. AI Ramp menandakan item baris perbelanjaan yang menyimpang daripada norma perbelanjaan kategori.

Pengesanan anomali adalah satu-satunya sub-keupayaan Predict yang tidak memerlukan data hasil berlabel. Model mempelajari pengagihan normal; ia tidak memerlukan contoh penipuan lalu yang dilabelkan sebagai sedemikian. Tetapi ia memerlukan jumlah. Syarikat yang memproses 50 transaksi seminggu tidak mempunyai jumlah untuk model penipuan yang bermakna. Syarikat yang memproses 50,000 memilikinya.

Cadangan (Recommendations)

Ramalkan pilihan untuk mencadangkan kandungan, produk, atau tindakan seterusnya yang paling relevan untuk pengguna tertentu. Model menggunakan sejarah tingkah laku ditambah persamaan profil untuk meramalkan apa yang akan dianggap berharga oleh seseorang.

Contoh sebenar: enjin cadangan Netflix meramalkan kebarangkalian penyiapan tontonan setiap pengguna. Salesforce Einstein Next Best Action mencadangkan tawaran mana yang perlu dibentangkan dalam interaksi sokongan. Sistem pengurusan pembelajaran menyusun kursus mengikut peranan, penyiapan lalu, dan tingkah laku rakan sebaya.

Pelajaran sejarah: Predict lebih lama daripada hype AI

Predict bukan inovasi 2022. Regresi logistik bermula pada tahun 1950-an. Pokok keputusan digunakan secara komersial pada tahun 1980-an. Kaedah ensemble seperti XGBoost menjadi dominan dalam pertandingan sains data pada awal 2010-an. Skor FICO diperkenalkan pada tahun 1989.

Apa yang berubah selepas 2022 bukan bahawa ramalan menjadi mungkin. Ia adalah infrastruktur awan yang menjadikan penggunaan model ramalan boleh diakses tanpa pasukan sains data, dan vendor SaaS menggabungkan model pra-latih ke dalam alat CRM supaya Predict menjadi ciri yang boleh dihidupkan. Kategori asasnya stabil. Predict adalah keupayaan paling matang dalam Rangka Kerja ACE, dengan rekod prestasi 30 tahun. Itu bermakna kita tahu banyak tentang bila ia berfungsi dan bila ia gagal.

Apa yang menjadikan Predict sukar

Algoritma biasanya bukan masalahnya. Lima faktor ini yang menjadi punca masalah.

Label merosot

Ini adalah masalah Daniel. Data latihannya merangkumi urusan dari 2022-2023, apabila pasukan menjual terutamanya kepada pembeli serantau kecil dalam kitaran 30 hari. Menjelang 2025, mereka telah beralih ke akaun yang lebih besar dengan kitaran enterprise 90 hari. Urusan "menang" dari 2022 tidak kelihatan seperti urusan "menang" yang dipedulikannya sekarang. Model mempelajari corak yang lapuk dan menerapkannya dengan setia kepada alam semesta yang salah.

Label merosot apabila perniagaan anda berubah: proses jualan, ICP, penetapan harga. Model tidak menyedarinya. Mereka terus menilai berdasarkan corak sejarah sehingga anda melatih semula. Model Predict memerlukan jadual latihan semula. Kebanyakan vendor tidak menyebut ini dalam kitaran jualan.

Peralihan pengagihan

Berkaitan tetapi berbeza: dunia berubah, dan model tidak mengetahuinya. Keluk permintaan COVID adalah contoh kanonik. Setiap model ramalan runcit yang dilatih pada data pra-2020 gagal pada Mac 2020. Model tidak pernah melihat penutupan rantaian bekalan global.

Peralihan pengagihan berlaku pada skala yang lebih kecil juga. Pesaing melancarkan dan mengubah kadar kemenangan anda. Saluran baru membawa profil pembeli yang berbeza. Model terus meramalkan berdasarkan pengagihan lama sehingga seseorang menyedari outputnya salah. Pengesanan memerlukan pemantauan: jejak sama ada ramalan sepadan dengan hasil dari masa ke masa. Tanpa gelung itu, peralihan pengagihan tidak kelihatan sehingga ia menjadi memalukan.

Keperluan kebolehjelasan

Untuk model penilaian prospek, "percaya skor" adalah menjengkelkan tetapi boleh diterima. Wakil mengabaikannya dan menghubungi prospek itu juga.

Untuk keputusan kredit, saringan pengambilan pekerja, atau pengunderaitan pinjaman, kebolehjelasan bukan pilihan. Di AS, Equal Credit Opportunity Act (ECOA) mensyaratkan pemohon yang dinafikan kredit menerima alasan tertentu. Artikel 22 GDPR EU memberikan individu hak terhadap keputusan automatik semata-mata dengan kesan ketara.

Model ML klasikal (regresi logistik, pokok keputusan cetek) boleh ditafsirkan secara semula jadi. XGBoost dan hutan rawak lebih sukar tetapi mempunyai alat kebolehjelasan seperti nilai SHAP. Peramal berasaskan rangkaian saraf paling sukar dijelaskan. Dalam perkhidmatan kewangan, penjagaan kesihatan, HR, atau undang-undang, kebolehjelasan adalah prasyarat penggunaan, bukan pilihan yang baik untuk dimiliki.

Set ujian kecil menyembunyikan kelemahan model

Sebuah syarikat dengan 400 urusan tertutup selama dua tahun mempunyai set latihan yang nipis untuk model penilaian prospek. Corak statistik yang kelihatan ketara pada 400 contoh sering tidak bertahan pada 4,000. Model kelihatan berfungsi dalam penilaian, kemudian berprestasi tidak menentu pada data langsung.

Vendor dengan model pra-latih yang mengambil dari berjuta-juta contoh merentas pelanggan (Salesforce Einstein, HubSpot Predictive Lead Scoring) sebahagiannya menyelesaikan masalah permulaan sejuk ini. Pertukaran ruginya ialah model mereka mempelajari corak seluruh industri, bukan corak khusus anda. Untuk kebanyakan pasukan pasaran pertengahan, bermula dengan model vendor dan memperhalusi selama 12-18 bulan adalah lebih realistik daripada melatih dari awal.

Hasil sejarah yang hilang

Predict memerlukan data berlabel. Penilaian jualan memerlukan urusan yang ditandakan menang atau kalah. Model Churn memerlukan akaun yang ditandakan Churn atau dikekalkan. Jika CRM anda tidak mempunyai medan menang/kalah yang wajib, atau ia bersifat pilihan dan diisi secara tidak konsisten, anda tidak mempunyai isyarat latihan untuk membina model yang bermakna.

Kesediaan data untuk Predict lebih menuntut daripada untuk Analyze. Analyze boleh mengekstrak nilai daripada teks tidak berstruktur dengan pelabelan minimum. Predict memerlukan rekod sejarah berlabel hasil, idealnya ratusan hingga ribuan, meliputi julat input dan hasil yang representatif.

Input dan output: jadual rujukan

Jenis input	Sub-keupayaan Predict biasa	Contoh output
Rekod CRM berstruktur + sejarah urusan	Penilaian	Skor kebarangkalian prospek (0–100)
Data hasil atau permintaan siri masa	Ramalan	Hasil suku tahun depan dengan selang keyakinan
Aktiviti tingkah laku + firmografi	Kedudukan	10 akaun teratas untuk dihubungi minggu ini
Strim transaksi	Pengesanan anomali	Transaksi yang ditandakan untuk semakan
Tingkah laku pengguna + persamaan rakan sebaya	Cadangan	5 produk / kursus / tindakan seterusnya

Alat untuk Predict: beli, integrasikan, atau bina

Terbina (beli): Salesforce Einstein menilai prospek dan peluang menggunakan data CRM anda ditambah isyarat latihan silang pelanggan Salesforce, berfungsi terbaik dengan 1,000+ urusan sejarah. HubSpot Predictive Lead Scoring memberi timbang aktiviti kenalan dan firmografi (Marketing Hub Professional ke atas). Gainsight PX membina skor kesihatan pelanggan daripada telemetri produk, jumlah sokongan, dan NPS.

Tersuai (integrasikan atau bina): scikit-learn adalah pustaka Python standard untuk ML klasikal. XGBoost dan LightGBM adalah pustaka peningkatan kecerunan yang mendominasi penanda aras ramalan data berstruktur. Prophet (sumber terbuka, dibangunkan oleh Meta) mengendalikan ramalan siri masa dengan musim dan titik perubahan arah aliran. Amazon SageMaker menyediakan latihan model terurus dan penggunaan pada AWS.

Ditambah LLM: Pendekatan terbaru bukan penggantian untuk Predict klasikal; ia adalah pelengkap. Bukannya "model berkata 74%," anda mendapat rantai penaakulan: "akaun ini mungkin akan tutup — mereka telah membuka empat e-mel, kontrak mereka tamat dalam 60 hari, dan tiga akaun serupa ditukar selepas panggilan penetapan harga." Klasikal lebih pantas, lebih murah, dan lebih boleh dijelaskan untuk keputusan jumlah tinggi. Yang ditambah LLM boleh menggabungkan isyarat tidak berstruktur (nada e-mel, kandungan transkrip) yang model klasikal sukar kendalikan. Kes guna yang memerlukan kebolehjelasan kawal selia masih memihak kepada klasikal.

Predict dan Analyze: padanan standard

Dalam amalan, Predict jarang beroperasi bersendirian. Corak standard adalah Analyze yang mengekstrak ciri berstruktur daripada data mentah, kemudian Predict yang menggunakan ciri tersebut untuk menghasilkan skor atau ramalan. Model Churn mungkin menggunakan Analyze untuk menarik skor sentimen dan frekuensi tiket daripada transkrip sokongan, kemudian memasukkannya ke dalam model Predict bersama data penggunaan produk. Inilah sebabnya keupayaan Rangka Kerja ACE boleh digabungkan: memahaminya sebagai atom yang berbeza membantu anda melihat di mana keperluan data setiap satu digunakan.

Senarai semak tadbir urus untuk penggunaan Predict

Predict tanpa tadbir urus adalah cara syarikat mendapat malu. Ini adalah minimum sebelum menggunakan sebarang sistem penilaian, ramalan, atau pengesanan anomali yang mempengaruhi keputusan perniagaan.

Kebolehauditan: Bolehkah anda menjelaskan ciri apa yang mendorong skor? Jika pengawal selia bertanya mengapa permohonan kredit ditolak, anda memerlukan jawapan yang boleh dipertahankan. Jejak kepentingan ciri untuk setiap model dalam pengeluaran.

Semakan keadilan: Adakah model berprestasi sama merentas kumpulan? Model penilaian prospek mewarisi bias sejarah. Jika kemenangan lalu condong ke geografi tertentu atas sebab yang tidak boleh diramalkan, model itu membenamkan kecenderungan itu. Jalankan audit keadilan asas sebelum menggunakan sebarang model yang mempengaruhi orang ramai.

Pengurangan bias: Untuk model yang mempengaruhi keputusan kakitangan (saringan pengambilan pekerja, cadangan kenaikan pangkat), pengujian untuk kesan tidak seimbang sebelum penggunaan adalah wajib, bukan pilihan.

Gerbang semakan manusia: Ramalan berisiko tinggi (keputusan kredit, penentuan keutamaan urusan besar) harus mempunyai manusia dalam gelung sebelum mendorong tindakan. Halakan skor ke manusia dan bukannya terus ke tindakan Execute.

Pemantauan drift: Periksa setiap suku tahun sama ada ramalan model sepadan dengan hasil. Jika ketepatan merosot, cetuskan semakan latihan semula sebelum output menjadi tidak bermakna.

Bila TIDAK menggunakan Predict

Apabila anda tidak mempunyai data sejarah berlabel. Syarikat permulaan dengan 90 urusan tertutup tidak mempunyai isyarat latihan untuk model penilaian yang bermakna. Gunakan pertimbangan, bina tabiat pelabelan, dan tunggu 500+ hasil.

Apabila masa depan berbeza secara struktural daripada masa lalu. Keluk permintaan pasca-COVID, kategori pasaran baru, perubahan kawal selia utama. Model Predict membuat ekstrapolasi daripada corak sejarah. Apabila masa depan tidak akan kelihatan seperti masa lalu, corak tersebut secara aktif mengelirukan. Model terus meramalkan; skor berlabuh pada dunia yang tidak lagi wujud.

Apabila keputusan adalah sekali sahaja dan tidak boleh dibalikkan. Keyakinan 87% masih bermakna 13% salah. Untuk keputusan di mana salah sekali adalah bencana (tindakan undang-undang tertentu, operasi kritikal keselamatan), output kebarangkalian bukan input yang betul. Anda memerlukan proses penilaian yang berbeza.

Apabila anda memerlukan kebenaran tepat dan bukan kebarangkalian. Predict memberitahu anda kemungkinan. Jika kes guna anda tidak boleh bertoleransi sebarang kadar ralat, Predict adalah keupayaan yang salah untuk gerbang keputusan.

Ringkasan yang jujur

Predict adalah keupayaan yang setiap eksekutif mahukan: "Beritahu saya siapa yang akan tutup. Beritahu saya ke mana hasil pergi. Beritahu saya siapa yang akan Churn." Dan ia paling kerap gagal dalam amalan, bukan kerana model adalah buruk tetapi kerana input adalah salah.

Rantai kegagalan adalah konsisten: label yang hilang atau tidak konsisten, data sejarah yang lapuk yang tidak lagi mencerminkan realiti semasa, tiada jadual latihan semula, dan tiada pemantauan untuk menangkap drift. Algoritma berfungsi. Data yang dipelajarinya tidak mewakili dunia yang diminta untuk diramalkan.

Kesediaan data untuk Predict lebih menuntut daripada untuk mana-mana keupayaan ACE lain. Anda memerlukan hasil berlabel, jumlah yang mencukupi, dan definisi konsisten tentang "menang," "Churn," atau "anomali." Dilakukan dengan betul, Predict memberikan ROI yang paling jelas: lebih sedikit masa terbuang pada prospek sejuk, peruntukan sumber yang lebih baik, intervensi Churn lebih awal. Syarikat pengedaran Daniel boleh mendapatkan isyarat amaran awal yang benar-benar berguna daripada tiga tahun data akaun berstruktur. Tetapi tidak sehingga mereka membetulkan label mereka.

Apa yang perlu dibaca seterusnya

Rangka Kerja ACE: cara Predict sesuai dengan empat keupayaan lain dalam tindanan penuh
Analyze: keupayaan yang memasukkan ciri berstruktur ke dalam model Predict
AI Ramalan vs. AI Generatif: pembahagian industri dijelaskan, dan di mana Predict sesuai
Kesediaan Data: prasyarat yang Predict bergantung padanya lebih daripada mana-mana keupayaan lain
Execute: apa yang berlaku selepas output Predict mendorong tindakan, dan mengapa keperluan tadbir urus meningkat
Evolusi AI Perniagaan: sejarah 30 tahun Predict, dari ML klasikal ke ramalan yang ditambah LLM moden

The ACE Framework Foundation