AGI (Kecerdasan Umum Buatan)
Sistem AI hipotetis yang dapat melakukan sebagian besar tugas intelektual pada tingkat manusia di banyak domain.
Terminologi teknis penting dijelaskan dengan tingkat kejelasan tertinggi. Dirancang untuk peneliti, pelajar, dan pendidikan yang berpusat pada manusia.
Menampilkan 213 istilah yang cocok.
Sistem AI hipotetis yang dapat melakukan sebagian besar tugas intelektual pada tingkat manusia di banyak domain.
Sebuah sistem perangkat lunak yang dapat mengamati, menalar, dan mengambil tindakan untuk mencapai suatu tujuan, sering kali menggunakan alat dan memori.
Pekerjaan membuat sistem AI berperilaku sesuai dengan niat manusia, nilai-nilai, dan batasan keselamatan.
Kebijakan, standar, dan mekanisme pengawasan yang memandu bagaimana AI dikembangkan dan digunakan di masyarakat.
Bidang yang berfokus pada pengurangan perilaku berbahaya, kegagalan, dan risiko penyalahgunaan dalam sistem AI.
Seperangkat aturan atau langkah yang diikuti komputer untuk memecahkan masalah atau menyelesaikan tugas.
Ketidakadilan sistematis dalam keluaran model yang disebabkan oleh ketidakseimbangan data, asumsi, atau pilihan pemodelan.
Seberapa jelas logika, sumber data, dan batasan sistem AI didokumentasikan dan dapat dipahami.
Label atau metadata yang ditambahkan manusia digunakan untuk melatih atau mengevaluasi model pembelajaran mesin.
Cara terstruktur bagi satu sistem perangkat lunak untuk mengirim permintaan dan menerima tanggapan dari sistem lain.
Bidang luas dalam membangun sistem yang melakukan tugas yang memerlukan pengenalan pola, penalaran, bahasa, atau pengambilan keputusan.
Komponen model yang secara dinamis berfokus pada bagian masukan yang relevan saat menghasilkan keluaran.
Sebuah sistem yang dapat mengambil keputusan dan bertindak dengan kendali manusia secara langsung atau terbatas secara real time.
Algoritme pelatihan inti yang memperbarui bobot model dengan menyebarkan kesalahan prediksi ke belakang melalui jaringan.
Model referensi sederhana yang digunakan untuk membandingkan apakah pendekatan yang lebih kompleks benar-benar meningkatkan hasil.
Tes atau kumpulan data standar yang digunakan untuk mengukur dan membandingkan kinerja model.
Pola kesalahan atau ketidakadilan yang konsisten dalam data atau perilaku model.
Kumpulan data yang sangat besar dan kompleks yang memerlukan penyimpanan dan teknik pemrosesan yang dapat diskalakan.
Model yang penalaran internalnya sulit diinterpretasikan langsung oleh manusia.
Seberapa cocok skor keyakinan model dengan probabilitas kebenaran sebenarnya.
Gaya penalaran di mana model AI menguraikan masalah menjadi langkah-langkah perantara.
Tugas di mana model memberikan masukan ke satu atau lebih kategori yang telah ditentukan sebelumnya.
Model yang dirancang khusus untuk tugas klasifikasi.
Arsitektur model multimodal yang mempelajari representasi bersama antara teks dan gambar.
Sumber daya pemrosesan yang diperlukan untuk melatih dan menjalankan model, sering kali diukur dalam jam FLOPS atau GPU.
Cabang AI yang mengekstrak makna dari gambar dan video.
Jumlah maksimum token masukan yang dapat diproses model bahasa sekaligus.
Pendekatan pelatihan yang memungkinkan model terus belajar dari data baru tanpa melupakan pengetahuan sebelumnya.
Arsitektur saraf yang dioptimalkan untuk memproses data seperti grid seperti gambar.
Fungsi tujuan umum yang digunakan untuk melatih model klasifikasi dengan memberikan penalti pada probabilitas yang salah.
Teknik yang membuat contoh pelatihan yang dimodifikasi untuk meningkatkan generalisasi model.
Pergeseran data masukan dunia nyata dari waktu ke waktu yang dapat menurunkan performa model.
Proses menetapkan tag atau keluaran target ke data mentah untuk pembelajaran yang diawasi.
Kumpulan contoh terstruktur atau tidak terstruktur yang digunakan untuk pelatihan, validasi, atau pengujian.
Permukaan dalam ruang fitur yang memisahkan kelas-kelas yang diprediksi oleh pengklasifikasi.
Model yang membuat prediksi melalui rangkaian pemisahan fitur jika-maka.
Bagian dari pembelajaran mesin yang menggunakan jaringan saraf banyak lapisan untuk pembelajaran representasi.
Arsitektur generatif yang belajar membalikkan noise untuk mensintesis gambar, audio, atau konten lainnya.
Mengompresi pengetahuan dari model guru yang besar menjadi model siswa yang lebih kecil.
Metode yang mentransfer model yang dilatih di satu domain agar berperforma lebih baik di domain lain.
Representasi vektor numerik yang menangkap makna semantik teks, gambar, atau data lainnya.
Komponen model yang mengubah masukan menjadi representasi laten.
Menggabungkan prediksi dari beberapa model untuk meningkatkan ketahanan atau akurasi.
Kumpulan data yang digunakan untuk mengukur kualitas model setelah pelatihan.
Sejauh mana perilaku model dapat diinterpretasikan dan dijelaskan kepada manusia.
Prediksi yang salah ketika model melewatkan kasus positif yang sebenarnya.
Prediksi yang salah ketika model salah menandai kasus negatif sebagai kasus positif.
Variabel masukan yang digunakan oleh model untuk membuat prediksi.
Merancang atau mentransformasikan variabel masukan agar pembelajaran lebih mudah dan efektif.
Mengubah data mentah menjadi fitur informatif yang dapat digunakan model.
Mempelajari atau mengadaptasi perilaku hanya dari sejumlah kecil contoh.
Melanjutkan pelatihan pada data spesifik domain untuk mengadaptasi model yang telah dilatih sebelumnya ke tugas tertentu.
Model besar yang telah dilatih sebelumnya dan dapat disesuaikan dengan banyak tugas hilir.
Kemampuan model untuk menghasilkan panggilan terstruktur yang memicu alat atau API eksternal.
Pengaturan generatif di mana generator dan diskriminator berlatih satu sama lain.
Seberapa baik performa model pada data baru yang tidak terlihat di luar set pelatihan.
Sistem AI yang menghasilkan konten baru seperti teks, gambar, audio, video, atau kode.
Vektor yang menunjukkan seberapa banyak setiap parameter harus diubah untuk mengurangi kerugian.
Metode optimasi yang memperbarui parameter ke arah yang mengurangi kesalahan.
Label referensi tepercaya yang digunakan untuk melatih atau mengevaluasi keluaran model.
Aturan, pemeriksaan, dan kontrol yang membatasi perilaku model yang tidak aman atau tidak diinginkan.
Ketika suatu model menghasilkan informasi yang lancar tetapi salah atau tidak didukung.
Alur kerja tempat manusia meninjau, memandu, atau mengesampingkan keluaran AI.
Nilai konfigurasi yang ditetapkan sebelum pelatihan, seperti kecepatan pembelajaran, ukuran batch, atau kedalaman.
Kemampuan model untuk mengikuti pola dari contoh yang diberikan langsung di prompt.
Fase runtime saat model terlatih menghasilkan prediksi atau keluaran.
Jumlah daya pemrosesan yang dikonsumsi saat menghasilkan setiap respons.
Menyempurnakan model pasangan instruksi-respons untuk meningkatkan kemampuan mengikuti tugas.
Memprediksi tujuan pengguna dari kueri teks untuk merutekannya dengan benar.
Teknik cepat yang dimaksudkan untuk melewati batasan keamanan model.
Titik waktu terakhir yang tercermin dalam data pelatihan model.
Melatih model yang lebih kecil untuk meniru keluaran model yang lebih besar.
Struktur grafik entitas dan hubungan yang digunakan untuk penalaran atau pengambilan.
Metode regularisasi yang memperhalus label keras untuk meningkatkan generalisasi.
Waktu antara mengirim permintaan dan menerima keluaran model.
Model bahasa yang dilatih pada corpora teks besar untuk menghasilkan dan menganalisis teks.
Hyperparameter pelatihan yang mengontrol seberapa banyak parameter berubah setiap langkah pembaruan.
Metode penyesuaian parameter yang efisien yang menambahkan matriks adaptor peringkat rendah.
Tujuan matematika yang mengukur kesalahan prediksi selama pelatihan.
Metode yang memungkinkan sistem mempelajari pola dari data dan meningkat seiring waktu.
Konteks tersimpan yang digunakan agen AI di seluruh langkah atau sesi untuk meningkatkan kontinuitas.
Arsitektur dengan subjaringan khusus yang hanya menjalankan pakar terpilih untuk setiap masukan.
Dokumentasi yang menjelaskan tujuan penggunaan model, metrik, batasan, dan risiko.
Penurunan kinerja seiring berjalannya waktu karena kondisi dunia nyata berbeda dari asumsi pelatihan.
Mengurangi presisi numerik bobot model untuk mengurangi biaya memori dan inferensi.
Model yang dapat memproses atau menghasilkan beberapa tipe data seperti teks, gambar, dan audio.
Tugas NLP yang mengidentifikasi entitas seperti orang, tempat, tanggal, atau organisasi.
Cabang AI berfokus pada pemahaman dan menghasilkan bahasa manusia.
Model komputasi berlapis yang terinspirasi oleh neuron dan sinapsis biologis.
Mengubah nilai ke skala yang konsisten untuk meningkatkan stabilitas pengoptimalan.
Teknologi yang mengubah teks dalam gambar atau pindaian menjadi teks yang dapat dibaca mesin.
Model yang dirilis dengan bobot atau kode publik untuk inspeksi, adaptasi, dan penggunaan kembali.
Saat model mengingat data pelatihan dan berperforma buruk pada masukan yang tidak terlihat.
Bobot yang dipelajari di dalam model yang memengaruhi keluarannya.
Metode yang mengadaptasi model dengan melatih sebagian kecil parameter tambahan.
Metrik model bahasa yang mengukur seberapa terkejut model tersebut dengan token berikutnya yang sebenarnya.
Alur kerja yang teratur dari prapemrosesan, langkah model, dan tahapan pascapemrosesan.
Proporsi prediksi positif yang sebenarnya benar.
Pelatihan model skala besar awal mengenai data luas sebelum adaptasi hilir.
Instruksi masukan dan konteks diberikan ke model generatif.
Merancang petunjuk untuk meningkatkan kualitas keluaran, keandalan, dan kemampuan pengendalian.
Pola serangan di mana instruksi berbahaya dimasukkan ke dalam input model atau konten yang diambil.
Menghapus bobot model atau neuron yang kurang penting untuk mengurangi ukuran dan komputasi.
Mengonversi bobot model ke format presisi lebih rendah seperti 8-bit atau 4-bit.
Sebuah metode yang mengambil pengetahuan eksternal dan memasukkannya ke dalam generasi pada waktu inferensi.
Proporsi hal positif aktual yang diidentifikasi dengan benar oleh model.
Saluran model yang memprediksi preferensi pengguna untuk menentukan peringkat konten atau produk.
Menguji stres sistem AI dengan petunjuk yang berlawanan untuk mengungkap kegagalan dan risiko.
Pelatihan dengan imbalan memberi sinyal saat agen mempelajari tindakan yang memaksimalkan keuntungan jangka panjang.
Sebuah metode pelatihan yang menggunakan sinyal preferensi manusia untuk membentuk perilaku model.
Menemukan dokumen atau catatan yang relevan dari sumber pengetahuan untuk kueri.
Model yang menilai keluaran berdasarkan sinyal preferensi, sering digunakan dalam saluran RLHF.
Kemampuan model untuk mempertahankan performa di bawah gangguan, pergeseran, atau masukan yang berlawanan.
Lapisan moderasi yang memblokir atau menulis ulang input atau output model yang tidak aman.
Hubungan empiris yang menunjukkan bagaimana performa meningkat seiring dengan ukuran model, data, atau komputasi.
Pencarian yang cocok dengan arti dan bukan kata kunci yang sama persis, sering kali menggunakan penyematan.
Mempelajari representasi dari data yang tidak berlabel dengan memprediksi bagian yang disamarkan atau ditransformasikan.
Tugas NLP yang mengklasifikasikan nada emosional atau opini dalam teks.
Model bahasa ringkas yang dioptimalkan untuk latensi, biaya, atau penggunaan pada perangkat yang lebih rendah.
Model yang banyak parameternya nol atau tidak aktif untuk mengurangi komputasi.
Melatih model dengan contoh berlabel yang memetakan masukan ke keluaran yang diketahui.
Data yang dihasilkan secara artifisial digunakan untuk menambah, menyimulasikan, atau melindungi data pelatihan sensitif.
Instruksi berprioritas tinggi yang menetapkan perilaku, kebijakan, dan gaya respons untuk suatu model.
Pengaturan pengambilan sampel yang mengontrol keacakan dalam keluaran yang dihasilkan.
Sepotong teks yang diproses oleh model bahasa, seperti potongan kata atau simbol.
Proses pemisahan teks menjadi token untuk masukan model.
Kemampuan model untuk memanggil alat eksternal seperti penelusuran, kalkulator, atau API.
Strategi decoding yang mengambil sampel hanya dari k kemungkinan besar token berikutnya.
Strategi decoding yang mengambil sampel dari kumpulan token terkecil yang probabilitasnya berjumlah p.
Menerapkan pengetahuan yang dipelajari dalam satu tugas atau domain untuk meningkatkan tugas lainnya.
Arsitektur saraf yang menggunakan perhatian untuk memodelkan hubungan lintas urutan secara paralel.
Nilai kesalahan model dihitung selama pelatihan dan dioptimalkan ke bawah seiring waktu.
Pola pembelajaran dari data tidak berlabel tanpa target keluaran yang jelas.
Kumpulan data yang digunakan selama pengembangan untuk menyesuaikan model dan mencegah overfitting.
Basis data yang dioptimalkan untuk menyimpan dan menanyakan vektor penyematan berdimensi tinggi.
Model multimodal yang secara bersama-sama memproses informasi visual dan tekstual.
Menggunakan label yang berisik, heuristik, atau parsial untuk melatih model ketika label yang bersih sulit diperoleh.
Nilai numerik yang dipelajari yang menskalakan sinyal yang melewati jaringan saraf.
Representasi vektor padat dari kata-kata yang menangkap hubungan semantik.
Teknik dan praktik untuk membuat prediksi AI lebih transparan dan mudah dipahami.
Menyelesaikan tugas tanpa contoh tugas spesifik dengan mengandalkan pengetahuan umum sebelumnya.
Proses multi-langkah di mana sistem AI merencanakan, mengeksekusi, memeriksa hasil, dan melakukan iterasi menuju suatu tujuan.
Kerangka peraturan Uni Eropa yang berbasis risiko untuk sistem dan penyedia AI.
Biaya tambahan dalam waktu, komputasi, atau kecepatan produk yang diperlukan untuk membuat sistem lebih aman dan terkendali.
Jika contoh pengujian benchmark atau varian yang mirip terdapat dalam data pelatihan, hal ini akan meningkatkan performa yang dilaporkan.
Metode untuk memperkirakan hubungan sebab-akibat daripada korelasi sederhana.
Rentang statistik yang kemungkinan berisi nilai sebenarnya dari metrik model yang diukur.
Pendekatan pelatihan dan pembentukan perilaku di mana keluaran model dipandu oleh serangkaian prinsip tertulis yang tetap.
Catatan dari mana data berasal, bagaimana data tersebut diubah, dan di mana data tersebut digunakan.
Asal, kepemilikan, dan riwayat kumpulan data atau artefak model yang terdokumentasi.
Teknik privasi yang menambahkan gangguan statistik sehingga catatan individual tidak dapat disimpulkan secara andal dari keluaran.
Model yang lebih kecil dilatih untuk meniru perilaku model yang lebih besar sambil menggunakan lebih sedikit komputasi pada inferensi.
Model yang dikhususkan untuk mengubah data menjadi vektor yang digunakan untuk pencarian semantik, pengelompokan, dan pengambilan.
Kerangka kerja evaluasi berulang yang menjalankan perintah, kumpulan data, dan logika penilaian di seluruh versi model.
Sistem terkelola untuk menyimpan dan menyajikan fitur ML yang divalidasi secara konsisten untuk pelatihan dan inferensi.
Sejauh mana respons AI didukung oleh sumber data atau bukti yang diambil.
Strategi pembangkitan yang membatasi token keluaran pada struktur yang valid atau pilihan yang sesuai dengan kebijakan.
Sebuah model yang dilatih berdasarkan peringkat manusia untuk memprediksi respons mana yang mungkin disukai pengguna.
Antarmuka API yang diterapkan yang menerima permintaan model dan mengembalikan prediksi dalam produksi.
Kumpulan dokumen atau catatan terkurasi yang digunakan untuk pengambilan, otomatisasi dukungan, atau respons dasar.
Ruang representasi terkompresi di mana konsep-konsep serupa diposisikan berdekatan satu sama lain sebagai vektor.
Katalog pusat untuk pembuatan versi, persetujuan, dan pelacakan model di seluruh lingkungan.
Inferensi AI dilakukan secara lokal pada perangkat keras pengguna, bukan pada layanan cloud jarak jauh.
Logika yang memvalidasi dan mengubah keluaran model menjadi struktur yang diketik dengan kuat dan dapat digunakan mesin.
Pola cepat yang dapat digunakan kembali dengan variabel, aturan pemformatan, dan instruksi khusus tugas.
Proporsi item yang diambil dan relevan dengan kueri pengguna.
Argumen terstruktur, didukung oleh bukti, bahwa sistem AI aman untuk konteks penggunaan tertentu.
Menjalankan model secara paralel dengan lalu lintas produksi tanpa memengaruhi keputusan yang diambil pengguna.
Output model dibatasi pada skema yang ditentukan seperti JSON, argumen alat, atau bidang yang diketik.
Perhitungan inferensi tambahan yang digunakan selama pembuatan respons untuk meningkatkan kualitas atau penalaran.
Menyelaraskan kepercayaan pengguna terhadap keluaran AI dengan keandalan sistem yang sebenarnya dalam setiap tugas.
Penetapan harga yang skala biayanya disesuaikan dengan panggilan API, token, waktu inferensi, atau komputasi yang digunakan.
Kebijakan di mana muatan permintaan/respons tidak disimpan setelah pemrosesan di luar jangka waktu operasional yang berumur pendek.
Metode percepatan inferensi di mana rancangan model kecil mengusulkan token yang diverifikasi secara paralel oleh model yang lebih besar.
Tensor kunci dan nilai tersimpan dari token sebelumnya yang memungkinkan transformator menghasilkan token baru tanpa menghitung ulang perhatian sebelumnya.
Protokol terbuka yang memungkinkan aplikasi AI terhubung ke alat eksternal, sumber data, dan penyedia konteks dengan cara standar.
Siklus berulang di mana agen AI mengamati, merencanakan, bertindak, dan melakukan refleksi hingga mencapai tujuan atau mencapai kondisi berhenti.
Pola dorongan yang menyisipkan langkah-langkah penalaran dengan tindakan penggunaan alat untuk menyelesaikan tugas dengan lebih andal.
Pendekatan penalaran dimana suatu model mengeksplorasi beberapa jalur solusi yang bercabang dan memilih yang paling menjanjikan.
Metode pelatihan yang menyempurnakan model secara langsung pada pasangan preferensi tanpa memerlukan model imbalan terpisah.
Teknik penyempurnaan yang menggabungkan kuantisasi bobot 4-bit dengan adaptor LoRA untuk mengurangi kebutuhan memori.
Algoritme perhatian yang dioptimalkan yang mengurangi penggunaan memori dan mempercepat pelatihan transformator dan inferensi.
Mekanisme transformator yang menjalankan beberapa operasi perhatian secara paralel untuk menangkap berbagai jenis hubungan.
Informasi ditambahkan ke penyematan token sehingga transformator dapat membedakan urutan urutan.
Metode pengkodean posisi yang memutar kueri dan vektor kunci untuk mengkodekan posisi token relatif.
Metode bias posisional yang memberikan penalti pada skor perhatian berdasarkan jarak tertentu, membantu model melakukan ekstrapolasi ke konteks yang lebih panjang.
Pola perhatian di mana setiap token hanya memperhatikan jendela berukuran tetap dari token terdekat untuk mengurangi komputasi.
Algoritme tokenisasi subkata yang menggabungkan pasangan karakter paling sering menjadi token yang dapat digunakan kembali.
Tokenizer tanpa bahasa yang mempelajari unit subkata langsung dari teks mentah tanpa terlebih dahulu membagi spasi.
Algoritma yang menemukan vektor yang mendekati kueri tanpa perbandingan menyeluruh, memperdagangkan ketepatan demi kecepatan.
Struktur indeks berbasis grafik untuk perkiraan pencarian tetangga terdekat dengan cepat melalui vektor berdimensi tinggi.
Model yang menyusun ulang kumpulan awal hasil yang diambil untuk menempatkan item yang paling relevan di urutan teratas.
Pendekatan pengambilan yang menggabungkan pencarian kata kunci (leksikal) dengan pencarian vektor (semantik) untuk perolehan dan presisi yang lebih baik.
Model yang menilai kueri dan dokumen secara bersamaan untuk penilaian relevansi dengan akurasi tinggi.
Model yang mengkodekan kueri dan dokumen ke dalam vektor terpisah sehingga dapat dibandingkan dengan cepat dalam skala besar.
Menggunakan model bahasa untuk menilai atau membandingkan keluaran dari model lain selama evaluasi.
Metrik evaluasi kode yang mengukur kemungkinan setidaknya satu dari k sampel yang dihasilkan lulus pengujian.
Sebuah tolok ukur yang menguji model bahasa di 57 mata pelajaran akademik dan profesional menggunakan pertanyaan pilihan ganda.
Tolok ukur masalah pemrograman Python yang digunakan untuk mengukur kebenaran pembuatan kode melalui pengujian unit.
Tolok ukur soal cerita matematika sekolah dasar yang digunakan untuk mengevaluasi penalaran langkah demi langkah dalam model bahasa.
Seberapa akurat klaim model sesuai dengan informasi dunia nyata yang dapat diverifikasi.
Referensi ke bagian sumber atau dokumen yang disertakan dalam respons model untuk mendukung klaimnya.
Menanamkan sinyal yang dapat dideteksi dalam teks atau media yang dihasilkan AI sehingga nantinya dapat diidentifikasi sebagai sinyal yang diproduksi oleh mesin.
Fase pelatihan perantara antara pra-pelatihan dan pasca-pelatihan, sering kali digunakan untuk penyesuaian kemampuan atau domain.
Langkah-langkah pelatihan diterapkan setelah pra-pelatihan, seperti penyetelan instruksi, optimalisasi preferensi, dan penyetelan keselamatan.
Penyiapan pelatihan tempat model ditingkatkan dengan menghasilkan data melalui interaksi atau kompetisi dengan salinan dirinya sendiri.
Metode pengambilan yang menghasilkan beberapa varian kueri, mengambil hasil untuk masing-masing varian, dan menggabungkan peringkat.
Teknik pengambilan yang menulis ulang kueri pengguna menjadi beberapa varian untuk meningkatkan ingatan.
Pola pengambilan yang mencari bagian kecil namun mengembalikan dokumen induk yang lebih besar untuk konteks yang lebih kaya.
Algoritme penguraian kode yang menyimpan beberapa urutan kandidat teratas di setiap langkah untuk menemukan keluaran dengan probabilitas lebih tinggi.
Pengaturan decoding yang menurunkan kemungkinan token yang telah dihasilkan model untuk mengurangi loop.
Pengaturan decoding yang mengurangi kemungkinan token secara proporsional dengan seberapa sering token tersebut muncul sejauh ini.
Pengaturan decoding yang mengurangi kemungkinan munculnya token, mendorong topik baru.