AGI (Kecerdasan Am Buatan)
Sistem AI hipotetikal yang boleh melaksanakan kebanyakan tugas intelektual pada peringkat manusia merentas banyak domain.
Terminologi teknikal penting dijelaskan pada tahap kejelasan tertinggi. Direka untuk penyelidik, pelajar dan pendidikan berpusatkan manusia.
Menunjukkan 213 istilah yang sepadan.
Sistem AI hipotetikal yang boleh melaksanakan kebanyakan tugas intelektual pada peringkat manusia merentas banyak domain.
Sistem perisian yang boleh memerhati, menaakul dan mengambil tindakan untuk mencapai matlamat, selalunya menggunakan alatan dan ingatan.
Kerja membuat sistem AI berkelakuan mengikut niat, nilai dan kekangan keselamatan manusia.
Dasar, piawaian dan mekanisme pengawasan yang membimbing cara AI dibangunkan dan digunakan dalam masyarakat.
Bidang yang memfokuskan pada mengurangkan tingkah laku berbahaya, kegagalan dan risiko penyalahgunaan dalam sistem AI.
Satu set peraturan atau langkah yang ditetapkan yang dipatuhi oleh komputer untuk menyelesaikan masalah atau menyelesaikan tugas.
Ketidakadilan sistematik dalam output model yang disebabkan oleh data yang condong, andaian atau pilihan pemodelan.
Betapa jelasnya logik, sumber data dan batasan sistem AI didokumenkan dan boleh difahami.
Label atau metadata tambahan manusia yang digunakan untuk melatih atau menilai model pembelajaran mesin.
Cara berstruktur untuk satu sistem perisian menghantar permintaan dan menerima respons daripada sistem lain.
Bidang luas sistem pembinaan yang melaksanakan tugas yang memerlukan pengecaman pola, penaakulan, bahasa atau membuat keputusan.
Komponen model yang memfokus secara dinamik pada bahagian input yang berkaitan apabila menghasilkan output.
Sistem yang boleh membuat keputusan dan bertindak dengan kawalan manusia yang terhad atau tiada langsung dalam masa nyata.
Algoritma latihan teras yang mengemas kini berat model dengan menyebarkan ralat ramalan ke belakang melalui rangkaian.
Model rujukan mudah yang digunakan untuk membandingkan sama ada pendekatan yang lebih kompleks sebenarnya meningkatkan hasil.
Ujian piawai atau set data yang digunakan untuk mengukur dan membandingkan prestasi model.
Corak kesilapan atau ketidakadilan yang konsisten dalam data atau tingkah laku model.
Set data yang sangat besar dan kompleks yang memerlukan storan dan teknik pemprosesan berskala.
Model yang penaakulan dalaman sukar untuk ditafsir secara langsung oleh manusia.
Sejauh mana skor keyakinan model sepadan dengan kebarangkalian ketepatan sebenar.
Gaya penaakulan di mana model AI menguraikan masalah kepada langkah perantaraan.
Tugas di mana model memberikan input kepada satu atau lebih kategori yang dipratentukan.
Model yang direka khusus untuk tugas klasifikasi.
Seni bina model multimodal yang mempelajari perwakilan yang dikongsi antara teks dan imej.
Sumber pemprosesan yang diperlukan untuk melatih dan menjalankan model, selalunya diukur dalam jam FLOPS atau GPU.
Cabang AI yang mengekstrak makna daripada imej dan video.
Jumlah maksimum token input model bahasa boleh diproses sekaligus.
Pendekatan latihan yang membolehkan model terus belajar daripada data baharu tanpa melupakan pengetahuan terdahulu.
Seni bina saraf yang dioptimumkan untuk memproses data seperti grid seperti imej.
Fungsi objektif biasa yang digunakan untuk melatih model klasifikasi dengan menghukum kebarangkalian yang salah.
Teknik yang mencipta contoh latihan yang diubah suai untuk meningkatkan generalisasi model.
Peralihan dalam data input dunia sebenar dari semasa ke semasa yang boleh merendahkan prestasi model.
Proses memberikan tag atau output sasaran kepada data mentah untuk pembelajaran diselia.
Koleksi contoh berstruktur atau tidak berstruktur yang digunakan untuk latihan, pengesahan atau ujian.
Permukaan dalam ruang ciri yang memisahkan kelas yang diramalkan oleh pengelas.
Model yang membuat ramalan melalui urutan pemisahan ciri jika-maka.
Subset pembelajaran mesin yang menggunakan rangkaian saraf banyak lapisan untuk pembelajaran perwakilan.
Seni bina generatif yang belajar membalikkan hingar untuk mensintesis imej, audio atau kandungan lain.
Memampatkan pengetahuan daripada model guru yang besar kepada model pelajar yang lebih kecil.
Kaedah yang memindahkan model yang dilatih dalam satu domain untuk berprestasi lebih baik dalam domain lain.
Perwakilan vektor berangka yang menangkap makna semantik teks, imej atau data lain.
Komponen model yang mengubah input kepada perwakilan terpendam.
Menggabungkan ramalan daripada berbilang model untuk meningkatkan keteguhan atau ketepatan.
Set data yang disimpan digunakan untuk mengukur kualiti model selepas latihan.
Sejauh mana tingkah laku model boleh ditafsir dan dijelaskan kepada manusia.
Ramalan yang salah apabila model terlepas kes positif sebenar.
Ramalan yang salah di mana model tersalah menandakan kes negatif sebagai positif.
Pembolehubah input yang digunakan oleh model untuk membuat ramalan.
Mereka bentuk atau mengubah pembolehubah input untuk menjadikan pembelajaran lebih mudah dan lebih berkesan.
Menukar data mentah kepada ciri bermaklumat yang boleh digunakan oleh model.
Mempelajari atau menyesuaikan tingkah laku daripada hanya sebilangan kecil contoh.
Meneruskan latihan tentang data khusus domain untuk menyesuaikan model pra-latihan kepada tugas tertentu.
Model pra-latihan yang besar yang boleh disesuaikan dengan banyak tugas hiliran.
Keupayaan model untuk menjana panggilan berstruktur yang mencetuskan alatan luaran atau API.
Persediaan generatif di mana penjana dan diskriminator melatih antara satu sama lain.
Seberapa baik prestasi model pada data baharu yang tidak kelihatan di luar set latihan.
Sistem AI yang menghasilkan kandungan baharu seperti teks, imej, audio, video atau kod.
Vektor yang menunjukkan berapa banyak setiap parameter harus berubah untuk mengurangkan kerugian.
Kaedah pengoptimuman yang mengemas kini parameter ke arah yang mengurangkan ralat.
Label rujukan yang dipercayai digunakan untuk melatih atau menilai output model.
Peraturan, semakan dan kawalan yang mengehadkan tingkah laku model yang tidak selamat atau tidak diingini.
Apabila model menjana maklumat yang lancar tetapi palsu atau tidak disokong.
Aliran kerja yang membolehkan manusia menyemak, membimbing atau mengatasi output AI.
Nilai konfigurasi yang ditetapkan sebelum latihan, seperti kadar pembelajaran, saiz kelompok atau kedalaman.
Keupayaan model untuk mengikuti corak daripada contoh yang diberikan secara langsung dalam gesaan.
Fasa masa jalan di mana model terlatih menjana ramalan atau output.
Jumlah kuasa pemprosesan yang digunakan semasa menghasilkan setiap tindak balas.
Memperhalusi model pada pasangan arahan-tindak balas untuk menambah baik mengikut tugasan.
Meramalkan tujuan pengguna daripada pertanyaan teks untuk mengarahkannya dengan betul.
Teknik segera bertujuan untuk memintas kekangan keselamatan model.
Titik masa terkini ditunjukkan dalam data latihan model.
Melatih model yang lebih kecil untuk meniru keluaran model yang lebih besar.
Struktur graf entiti dan perhubungan yang digunakan untuk menaakul atau mendapatkan semula.
Kaedah regularisasi yang melembutkan label keras untuk meningkatkan generalisasi.
Masa antara menghantar permintaan dan menerima output model.
Model bahasa yang dilatih mengenai korpora teks besar-besaran untuk menjana dan menganalisis teks.
Hiperparameter latihan yang mengawal berapa banyak parameter mengubah setiap langkah kemas kini.
Kaedah penalaan halus yang cekap parameter yang menambah matriks penyesuai peringkat rendah.
Objektif matematik yang mengukur ralat ramalan semasa latihan.
Kaedah yang membolehkan sistem mempelajari corak daripada data dan bertambah baik dari semasa ke semasa.
Konteks tersimpan yang digunakan ejen AI merentas langkah atau sesi untuk meningkatkan kesinambungan.
Seni bina dengan subrangkaian khusus yang hanya pakar terpilih dijalankan setiap input.
Dokumentasi yang menerangkan tujuan penggunaan model, metrik, had dan risiko.
Kemerosotan prestasi dari semasa ke semasa kerana keadaan dunia sebenar menyimpang daripada andaian latihan.
Mengurangkan ketepatan berangka berat model untuk mengurangkan kos ingatan dan inferens.
Model yang boleh memproses atau menjana berbilang jenis data seperti teks, imej dan audio.
Tugas NLP yang mengenal pasti entiti seperti orang, tempat, tarikh atau organisasi.
Cawangan AI menumpukan pada pemahaman dan penjanaan bahasa manusia.
Model pengiraan berlapis yang diilhamkan oleh neuron biologi dan sinaps.
Mengubah nilai kepada skala yang konsisten untuk meningkatkan kestabilan pengoptimuman.
Teknologi yang menukar teks dalam imej atau mengimbas kepada teks yang boleh dibaca mesin.
Model yang dikeluarkan dengan pemberat awam atau kod untuk pemeriksaan, penyesuaian dan penggunaan semula.
Apabila model menghafal data latihan dan berprestasi buruk pada input yang tidak kelihatan.
Berat yang dipelajari dalam model yang mempengaruhi outputnya.
Kaedah yang menyesuaikan model dengan melatih subset kecil parameter tambahan.
Metrik model bahasa yang mengukur betapa terkejutnya model dengan token seterusnya yang benar.
Aliran kerja tertib prapemprosesan, langkah model dan peringkat pasca pemprosesan.
Perkadaran positif yang diramalkan yang sebenarnya betul.
Latihan model berskala besar awal mengenai data luas sebelum penyesuaian hiliran.
Arahan input dan konteks yang diberikan kepada model generatif.
Mereka bentuk gesaan untuk meningkatkan kualiti output, kebolehpercayaan dan kebolehkawalan.
Corak serangan yang mana arahan berniat jahat dimasukkan ke dalam input model atau kandungan yang diambil semula.
Mengalih keluar pemberat model atau neuron yang kurang penting untuk mengurangkan saiz dan mengira.
Menukar pemberat model kepada format ketepatan yang lebih rendah seperti 8-bit atau 4-bit.
Kaedah yang mendapatkan semula pengetahuan luaran dan menyalurkannya kepada generasi pada masa inferens.
Perkadaran positif sebenar yang dikenal pasti dengan betul oleh model.
Saluran paip model yang meramalkan keutamaan pengguna untuk kedudukan kandungan atau produk.
Menguji tekanan sistem AI dengan gesaan lawan untuk mendedahkan kegagalan dan risiko.
Latihan melalui isyarat ganjaran di mana ejen mempelajari tindakan yang memaksimumkan pulangan jangka panjang.
Kaedah latihan yang menggunakan isyarat keutamaan manusia untuk membentuk tingkah laku model.
Mencari dokumen atau rekod yang berkaitan daripada sumber pengetahuan untuk pertanyaan.
Model yang menjaringkan output berdasarkan isyarat keutamaan, sering digunakan dalam saluran paip RLHF.
Keupayaan model untuk mengekalkan prestasi di bawah bunyi bising, peralihan atau input lawan.
Lapisan penyederhanaan yang menyekat atau menulis semula input atau output model yang tidak selamat.
Hubungan empirikal yang menunjukkan cara prestasi bertambah baik dengan saiz model, data atau pengiraan.
Carian yang sepadan dengan makna dan bukannya kata kunci yang bertindih tepat, selalunya menggunakan benam.
Mempelajari perwakilan daripada data tidak berlabel dengan meramalkan bahagian bertopeng atau diubah.
Tugas NLP yang mengklasifikasikan nada emosi atau pendapat dalam teks.
Model bahasa padat yang dioptimumkan untuk kependaman, kos atau penggunaan pada peranti yang lebih rendah.
Model di mana banyak parameter adalah sifar atau tidak aktif untuk mengurangkan pengiraan.
Melatih model dengan contoh berlabel yang memetakan input kepada output yang diketahui.
Data yang dijana secara buatan digunakan untuk menambah, mensimulasikan atau melindungi data latihan yang sensitif.
Arahan keutamaan tinggi yang menetapkan tingkah laku, dasar dan gaya tindak balas untuk model.
Tetapan pensampelan mengawal rawak dalam output yang dihasilkan.
Sepotong teks yang diproses oleh model bahasa, seperti sekeping perkataan atau simbol.
Proses pembahagian teks kepada token untuk input model.
Keupayaan model untuk memanggil alat luaran seperti carian, kalkulator atau API.
Strategi penyahkodan yang hanya mengambil sampel daripada k kemungkinan besar token seterusnya.
Strategi penyahkodan yang mengambil sampel daripada set token terkecil yang kebarangkaliannya berjumlah p.
Mengaplikasikan pengetahuan yang dipelajari dalam satu tugasan atau domain untuk memperbaiki tugasan yang lain.
Seni bina saraf yang menggunakan perhatian kepada perhubungan model merentas jujukan secara selari.
Nilai ralat model yang dikira semasa latihan dan dioptimumkan ke bawah dari semasa ke semasa.
Corak pembelajaran daripada data tidak berlabel tanpa output sasaran yang jelas.
Set data yang digunakan semasa pembangunan untuk menala model dan mengelakkan pemasangan berlebihan.
Pangkalan data yang dioptimumkan untuk menyimpan dan menanyakan vektor benam berdimensi tinggi.
Model multimodal yang memproses maklumat visual dan teks secara bersama.
Menggunakan label yang bising, heuristik atau separa untuk melatih model apabila label bersih terhad.
Nilai berangka yang dipelajari yang menskalakan isyarat yang melalui rangkaian saraf.
Perwakilan vektor padat perkataan yang menangkap hubungan semantik.
Teknik dan amalan untuk membuat ramalan AI lebih telus dan mudah difahami.
Menyelesaikan tugas tanpa contoh khusus tugasan dengan bergantung pada pengetahuan am terdahulu.
Proses berbilang langkah di mana sistem AI merancang, melaksanakan, menyemak keputusan dan berulang ke arah matlamat.
Rangka kerja kawal selia berasaskan risiko Kesatuan Eropah untuk sistem dan pembekal AI.
Kos tambahan dalam masa, pengiraan atau halaju produk yang diperlukan untuk menjadikan sistem lebih selamat dan lebih terkawal.
Apabila contoh ujian penanda aras atau varian hampir hadir dalam data latihan, meningkatkan prestasi yang dilaporkan.
Kaedah untuk menganggar hubungan sebab-akibat dan bukannya korelasi mudah.
Julat statistik yang mungkin mengandungi nilai sebenar metrik model yang diukur.
Pendekatan latihan dan pembentukan tingkah laku di mana output model dipandu oleh set tetap prinsip bertulis.
Rekod dari mana data datang, cara ia diubah, dan dari mana ia digunakan.
Asal yang didokumenkan, pemilikan dan sejarah set data atau artifak model.
Teknik privasi yang menambah bunyi statistik supaya rekod individu tidak boleh disimpulkan dengan pasti daripada output.
Model yang lebih kecil dilatih untuk meniru tingkah laku model yang lebih besar sambil menggunakan kurang pengiraan pada inferens.
Model khusus untuk menukar data kepada vektor yang digunakan untuk carian semantik, pengelompokan dan perolehan semula.
Rangka kerja penilaian berulang yang menjalankan gesaan, set data dan logik pemarkahan merentas versi model.
Sistem terurus untuk menyimpan dan menyediakan ciri ML yang disahkan secara konsisten untuk latihan dan inferens.
Tahap tindak balas AI disokong oleh data sumber atau bukti yang diperoleh.
Strategi penjanaan yang mengekang token output kepada struktur yang sah atau pilihan yang mematuhi dasar.
Model yang dilatih mengenai kedudukan manusia untuk meramalkan respons yang mungkin lebih disukai pengguna.
Antara muka API yang digunakan yang menerima permintaan model dan mengembalikan ramalan dalam pengeluaran.
Koleksi dokumen atau rekod yang dipilih susun yang digunakan untuk mendapatkan semula, menyokong automasi atau respons asas.
Ruang perwakilan termampat di mana konsep serupa diletakkan berdekatan antara satu sama lain sebagai vektor.
Katalog pusat untuk membuat versi, meluluskan dan menjejak model merentas persekitaran.
Inferens AI dilakukan secara setempat pada perkakasan pengguna dan bukannya dalam perkhidmatan awan jauh.
Logik yang mengesahkan dan menukar output model kepada struktur yang ditaip kuat dan boleh digunakan oleh mesin.
Corak gesaan yang boleh digunakan semula dengan pembolehubah, peraturan pemformatan dan arahan khusus tugas.
Perkadaran item yang diambil semula yang berkaitan dengan pertanyaan pengguna.
Hujah berstruktur, disokong oleh bukti, bahawa sistem AI selamat untuk konteks penggunaan yang ditentukan.
Menjalankan model selari dengan trafik pengeluaran tanpa menjejaskan keputusan yang dihadapi pengguna.
Output model dihadkan kepada skema yang ditentukan seperti JSON, argumen alat atau medan ditaip.
Pengiraan inferens tambahan yang digunakan semasa penjanaan tindak balas untuk meningkatkan kualiti atau penaakulan.
Menyelaraskan keyakinan pengguna dalam output AI dengan kebolehpercayaan sebenar sistem dalam setiap tugas.
Penetapan harga dengan skala kos dengan panggilan API, token, masa inferens atau pengiraan yang digunakan.
Dasar di mana muatan permintaan/tindak balas tidak disimpan selepas diproses melangkaui tetingkap operasi jangka pendek.
Kaedah pecutan inferens di mana model draf kecil mencadangkan token yang disahkan oleh model yang lebih besar secara selari.
Tensor kunci dan nilai yang disimpan daripada token sebelumnya yang membolehkan transformer menjana token baharu tanpa mengira semula perhatian masa lalu.
Protokol terbuka yang membolehkan aplikasi AI menyambung ke alat luaran, sumber data dan penyedia konteks dengan cara yang standard.
Kitaran berulang di mana ejen AI memerhati, merancang, bertindak dan mencerminkan sehingga ia melengkapkan matlamat atau mencapai keadaan berhenti.
Corak gesaan yang menyelangi langkah penaakulan dengan tindakan penggunaan alat untuk menyelesaikan tugasan dengan lebih dipercayai.
Pendekatan penaakulan di mana model meneroka berbilang laluan penyelesaian percabangan dan memilih yang paling menjanjikan.
Kaedah latihan yang memperhalusi model secara langsung pada pasangan pilihan tanpa memerlukan model ganjaran yang berasingan.
Teknik penalaan halus yang menggabungkan pengkuantitian berat 4-bit dengan penyesuai LoRA untuk mengurangkan keperluan memori.
Algoritma perhatian yang dioptimumkan yang mengurangkan penggunaan memori dan mempercepatkan latihan dan inferens transformer.
Mekanisme pengubah yang menjalankan beberapa operasi perhatian secara selari untuk menangkap pelbagai jenis perhubungan.
Maklumat ditambahkan pada pembenaman token supaya transformer boleh membezakan susunan jujukan.
Kaedah pengekodan kedudukan yang memutarkan pertanyaan dan vektor kunci untuk mengekod kedudukan token relatif.
Kaedah berat sebelah kedudukan yang menghukum skor perhatian berdasarkan jarak token, membantu model mengekstrapolasi kepada konteks yang lebih panjang.
Corak perhatian di mana setiap token hadir hanya pada tetingkap saiz tetap token berdekatan untuk mengurangkan pengiraan.
Algoritma tokenisasi subkata yang menggabungkan pasangan aksara yang paling kerap menjadi token boleh guna semula.
Tokenizer agnostik bahasa yang mempelajari unit subkata terus daripada teks mentah tanpa membahagikan pada ruang kosong.
Algoritma yang mencari vektor hampir dengan pertanyaan tanpa perbandingan menyeluruh, berdagang ketepatan untuk kelajuan.
Struktur indeks berasaskan graf untuk carian jiran terdekat anggaran pantas ke atas vektor dimensi tinggi.
Model yang menyusun semula set awal keputusan yang diambil untuk meletakkan item yang paling berkaitan di bahagian atas.
Pendekatan mendapatkan semula yang menggabungkan carian kata kunci (leksikal) dengan carian vektor (semantik) untuk ingatan dan ketepatan yang lebih baik.
Model yang menjaringkan pertanyaan dan dokumen bersama-sama dalam satu pas untuk pertimbangan perkaitan ketepatan tinggi.
Model yang mengekod pertanyaan dan dokumen ke dalam vektor yang berasingan supaya ia boleh dibandingkan dengan cepat pada skala.
Menggunakan model bahasa untuk menjaringkan atau membandingkan output daripada model lain semasa penilaian.
Metrik penilaian kod yang mengukur peluang bahawa sekurang-kurangnya satu daripada k sampel yang dijana lulus ujian.
Penanda aras menguji model bahasa merentas 57 subjek akademik dan profesional menggunakan soalan aneka pilihan.
Penanda aras masalah pengaturcaraan Python yang digunakan untuk mengukur ketepatan penjanaan kod melalui ujian unit.
Penanda aras masalah perkataan matematik sekolah gred yang digunakan untuk menilai penaakulan langkah demi langkah dalam model bahasa.
Betapa tepatnya tuntutan model sepadan dengan maklumat dunia sebenar yang boleh disahkan.
Rujukan kepada petikan sumber atau dokumen yang disertakan dalam respons model untuk menyokong tuntutannya.
Membenamkan isyarat yang boleh dikesan dalam teks atau media yang dijana AI supaya kemudiannya boleh dikenal pasti sebagai dihasilkan mesin.
Fasa latihan pertengahan antara pralatihan dan pasca latihan, sering digunakan untuk pelarasan keupayaan atau domain.
Langkah latihan digunakan selepas pralatihan, seperti penalaan arahan, pengoptimuman keutamaan dan penalaan keselamatan.
Persediaan latihan di mana model bertambah baik dengan menjana data melalui interaksi atau pertandingan dengan salinan dirinya sendiri.
Kaedah mendapatkan semula yang menjana berbilang variasi pertanyaan, mendapatkan semula hasil untuk setiap satu dan menggabungkan kedudukan.
Teknik mendapatkan semula yang menulis semula pertanyaan pengguna ke dalam beberapa varian untuk meningkatkan ingatan semula.
Corak pengambilan semula yang mencari potongan kecil tetapi mengembalikan dokumen induknya yang lebih besar untuk konteks yang lebih kaya.
Algoritma penyahkodan yang mengekalkan beberapa jujukan calon teratas pada setiap langkah untuk mencari output berkemungkinan lebih tinggi.
Tetapan penyahkodan yang mengurangkan kebarangkalian token yang telah dihasilkan oleh model untuk mengurangkan gelung.
Tetapan penyahkodan yang mengurangkan kebarangkalian token secara berkadar dengan kekerapan token itu muncul setakat ini.
Tetapan penyahkodan yang mengurangkan kebarangkalian token yang telah muncul sama sekali, menggalakkan topik baharu.