Mengenal Machine Translation Tools yang Menjadi Dasar Google Translate

Artikel ini menjelaskan tentang teknologi penerjemah machine translation (MT atau MT Tools) dan computer-assisted translation (CAT atau CAT Tools), mulai dari perbedaan MT dan CAT Tools, jenis-jenisnya, hingga cara kerjanya.

Siapa sih yang nggak kenal Google Translate (Google Terjemahan)? Aplikasi besutan Google yang satu ini menjadi andalan banyak orang untuk menerjemahkan kata-kata atau kalimat dari bahasa Indonesia ke bahasa asing atau sebaliknya. Mesin penerjemah otomatis ini memungkinkan kita menerjemahkan suatu bahasa dengan lebih cepat dan praktis.

Jasa Translate Dokumen

Google Translate dikenal dengan kemampuannya melayani terjemahan dalam 109 bahasa di seluruh dunia, termasuk bahasa Indonesia dan bahasa Inggris. Selain itu, Google Translate memiliki beragam fitur terjemahan di web dan aplikasi yang memudahkan kita. Sebut saja deteksi bahasa, menerjemahkan lewat suara dan tulisan, hingga menerjemahkan teks fisik secara instan melalui kamera.

Bagaimana Google Translate bekerja? Ada beberapa teknologi yang diterapkan Google Translate dalam menjalankan fiturnya, seperti speech-to-text dan pengenalan tulisan. Namun, yang pasti, teknologi penerjemahan ada di balik kemampuan Google Translate menerjemahkan suatu bahasa. Seperti apa teknologi terjemahan yang ada?

Teknologi Penerjemahan

Teknologi penerjemahan kini menjadi solusi dari masalah menerjemahkan kata atau kalimat dari satu bahasa ke bahasa lain. Adanya teknologi membuat kegiatan menerjemahkan makin praktis dan efisien. Kita nggak perlu banyak bergantung pada penerjemah atau kamus untuk dapat menerjemahkan.

Jasa Proofreading Dokumen

Ada beberapa faktor yang membuat teknologi penerjemahan makin diperlukan. Kemajuan teknologi informasi membuat banyak teks yang diterjemahkan tidak tercetak di atas kertas, melainkan di perangkat komputer atau gawai secara digital. Selain itu, kesibukan masyarakat saat ini yang makin produktif dalam menyelesaikan tugas-tugasnya juga membuat perlunya sistem terjemahan yang praktis, efisien, dan dapat diandalkan. Seorang penerjemah, seperti halnya manusia lainnya, juga memiliki ilmu, tenaga, konsentrasi, dan emosi yang terbatas, sehingga teknologi penerjemahan dianggap dapat mengurangi beban penerjemah manusia (bahkan bisa menggantikannya).

Secara dasar, terdapat dua teknologi penerjemahan yang banyak digunakan, yakni machine translation (MT atau MT Tools) dan computer-assisted translation (CAT atau CAT Tools). Keduanya memiliki definisi yang berbeda, dengan berbagai turunan metode penerjemahan yang berbeda. Yuk kita simak!

Perbedaan Machine Translation Tools dan CAT Tools

Jasa Proofreading Dokumen

Apa sih bedanya MT Tools dan CAT Tools? Perbedaan MT Tools dan CAT Tools terletak dari ada atau tidaknya campur tangan manusia dalam proses menerjemahkan kata atau kalimat. Teknologi MT Tools hanya mengandalkan mesin penerjemah untuk menerjemahkan suatu kata atau kalimat, sehingga tidak diperlukan bantuan manusia. Sebaliknya, teknologi CAT Tools pada dasarnya merupakan sistem penerjemahan oleh manusia dengan bantuan komputer, sehingga ada keterlibatan manusia di sini.

Machine Translation (MT Tools)

Machine translation (MT atau MT Tools) secara harfiah berarti “terjemahan mesin”. Ini menunjukkan bahwa machine translation adalah teknologi penerjemahan satu bahasa ke bahasa lain melalui mesin penerjemah secara otomatis.

MT secara garis besar melakukan penggantian kata-kata dalam suatu bahasa dengan kata-kata dalam bahasa lain. Walau demikian, susunan kata dan tata bahasa masing-masing juga harus dapat dikuasai oleh mesin tersebut supaya mendapatkan keluaran terjemahan yang berkualitas. Tantangan lain dalam mengembangkan teknologi ini ialah ambiguitas dan fleksibilitas bahasa manusia, yang terjadi secara alami seiring berjalannya waktu.

Cara Kerja Machine Translation Tools

Secara umum, ada lima proses penerjemahan dengan teknologi MT Tools:

  • Analisis morfologi (morphological analysis): Langkah pertama ini menganalisis teks sumber secara permukaan, apakah sebuah kata termasuk kata benda, kata sifat, atau yang lain, serta penentuan sub-kategorinya (jamak/tunggal, gender, tata bahasa, dan lain-lain.)
  • Kategorisasi leksikal (lexical categorisation): Dalam langkah ini, konteks kata dianalisis untuk menentukan makna kata tersebut.
  • Pemindahan leksikal (lexical transfer): Dalam langkah ini, terjadi proses pemilihan kata dalam bahasa tujuan dari kamusnya.
  • Pemindahan struktur (structural transfer): Menyusun kata ke dalam frasa dengan struktur yang benar, “concordance“, dll.
  • Pembentukan morfologi (morphological generation): Langkah terakhir ini akan menyusun kalimat dalam bahasa tujuan.
cara kerja mesin penerjemah
Bagan sederhana proses terjemahan dengan terjemahan mesin (MT Tools).

Jenis-Jenis Machine Translation Tools

Ada beberapa pendekatan terjemahan yang merupakan turunan dari MT Tools, mulai dari yang sederhana hingga yang kompleks. Masing memiliki basis yang berbeda dalam melakukan penerjemahan, namun masih sama-sama mampu melakukan kegiatan penerjemahan secara otomatis tanpa bantuan manusia. Jenis-jenis pendekatan terjemahan mesin antara lain dictionary-based, rule-based, transfer-based, statistical, example-based, interlingual, neural, dan hybrid.

Dictionary-based machine translation

Dictionary-based machine translation (terjemahan mesin berbasis kamus) adalah pendekatan terjemahan mesin yang berdasarkan pada entri yang ada pada kamus. Mesin penerjemah akan menerjemahkan kata demi kata dari bahasa sumber ke bahasa tujuan. Pendekatan ini cocok digunakan untuk menerjemahkan kata-kata yang pendek, bukan kalimat-kalimat panjang.

Rule-based machine translation

Rule-based machine translation (terjemahan mesin berbasis aturan) adalah pendekatan terjemahan mesin yang berdasarkan pada aturan-aturan bahasa yang diajarkan kepada mesin penerjemah. Aturan-aturan yang diajarkan meliputi kamus dan tata bahasa (baik unilingual, dwibahasa, atau multibahasa) yang mencakup semantik utama, morfologi, dan sintaksis keteraturan dari tiap bahasa. Oleh karena melibatkan aturan bahasa, rule-based biasanya menghasilkan terjemahan yang lebih sempurna dibandingkan dictionary-based.

Transfer-based machine translation

Transfer-based machine translation (terjemahan mesin berbasis transfer) adalah pendekatan terjemahan mesin yang berdasarkan pada transfer struktur bahasa dari suatu teks untuk dicocokkan dengan struktur pada bahasa tujuan. Transfer tersebut dilakukan setelah menganalisis teks dari bahasa sumber untuk menentukan struktur tata bahasanya. Ini melibatkan perantara berupa aturan-aturan linguistik yang menangkap makna dari teks asli, namun berbeda dengan rule-based, perantara dalam transfer-based tidak sepenuhnya bergantung pada kamus dan memiliki bentuknya sendiri dalam sebagian hal. Transfer-based merupakan pendekatan yang mulai menerapkan lima proses penerjemahan MT Tools secara lengkap.

Interlingual machine translation

Interlingual machine translation adalah pendekatan terjemahan mesin yang dijembatani oleh sebuah perantara representatif, bernama interlingua. Dalam pendekatan ini, teks yang akan diterjemahkan diubah ke dalam bentuk interlingua, untuk kemudian diubah kembali ke teks bahasa tujuan. Berbeda dengan perantara dalam transfer-based, perantara interlingua bersifat mandiri dan tidak bergantung pada bahasa mana pun.

Interlingua sebagai perantara dalam terjemahan mesin interlingual.
Interlingua sebagai perantara dalam terjemahan mesin interlingual. (Wikimedia Commons)

Statistical machine translation

Statistical machine translation (terjemahan mesin statistik) adalah pendekatan terjemahan mesin yang berdasarkan pada model statistik yang parameternya berasal dari analisis corpora teks (badan teks) dwibahasa – yakni teks sumber yang akan diterjemahkan dan teks tujuan yang belum diterjemahkan. Pendekatan ini dimulai dengan kumpulan data dari terjemahan sebelumnya yang sangat besar dan telah disetujui, dikenal sebagai korpus teks (bentuk jamak dari corpora), yang kemudian digunakan untuk secara otomatis menyimpulkan model statistik terjemahan. Model ini lalu diterapkan pada teks tujuan yang tidak diterjemahkan untuk membuat kecocokan berdasarkan probabilitas untuk menghasilkan terjemahan yang masuk akal.

Example-based machine translation

Example-based machine translation (terjemahan mesin berbasis contoh) adalah pendekatan terjemahan mesin yang berdasarkan pada corpus dwibahasa, namun dengan teks paralel sebagai basis pengetahuan utama pada saat menjalankan proses terjemahan. Dasar dari pendekatan ini adalah terjemahan dengan menggunakan analogi pada terjemahan yang telah dipelajari sebelumnya. Dengan pola yang dicontohkan, mesin akan menggunakan contoh tersebut untuk mempermudah proses terjemahan.

Neural machine translation

Neural machine translation (terjemahan mesin berbasis saraf) adalah pendekatan terjemahan mesin yang memanfaatkan jaringan saraf tiruan untuk memperkirakan urutan kata, yang biasanya akan memodelkan seluruh kalimat dalam satu model terintegrasi. Pendekatan ini memungkinkan konteks terjemahan dan hasil terjemahan yang lebih akurat. Google Translate, yang kita bahas di awal, menggunakan pendekatan ini dalam proses terjemahannya.

Hybrid machine translation

Hybrid machine translation (terjemahan mesin campuran) adalah pendekatan terjemahan mesin yang memadukan beberapa pendekatan terjemahan dalam satu langkah. Pendekatan ini mengambil kelebihan dari berbagai pendekatan yang ada untuk mendapat akurasi terjemahan yang lebih sempurna. Beberapa mesin terjemahan yang menggunakan pendekatan ini berhasil mengeluarkan hasil terjemahan yang lebih akurat.

Baca juga: Aplikasi Subtitle Otomatis dan Cara Membuat Subtitle Film Otomatis

Computer-assisted translation (CAT Tools)

Berbeda dengan machine translation, computer-assisted translation (CAT atau CAT Tools) adalah teknologi penerjemahan satu bahasa ke bahasa lain yang pada dasarnya masih dilakukan oleh manusia, hanya saja dibantu dengan komputer. Computer-assisted translation sendiri – yang juga disebut dengan Computer-aided translation – secara harfiah berarti “terjemahan berbantuan komputer”. Apa yang dimaksud sebagai “komputer” di sini biasanya ialah perangkat lunak (software) khusus untuk terjemahan.

CAT Tools merupakan istilah yang dapat digunakan untuk berbagai macam teknologi penerjemahan. Mulai dari pemeriksa ejaan, pemeriksa tata bahasa, memori terjemahan (translation memory), dan sebagainya. Bahkan kamus elektronik yang dahulu pernah tren di kalangan pelajar dan mahasiswa merupakan salah satu contoh CAT Tools.

skema kerja Computer-assisted translation (CAT Tools)
Bagan sederhana proses terjemahan dengan terjemahan berbantuan komputer (CAT Tools).

Cara Kerja CAT Tools

Menurut Dina Begum, cara kerja CAT Tools adalah dengan menghimpun semua teks yang pernah kita terjemahkan ke dalam suatu memori terjemahan. Pada saat kita menerjemahkan sesuatu yang mirip atau sama dengan yang pernah kita terjemahkan sebelumnya, terjemahannya langsung tampil di layar sehingga tidak perlu ditulis lagi. Dengan demikian kegiatan penerjemahan bisa lebih menghemat waktu, dan hasilnya bisa lebih konsisten.

Oleh karena manfaatnya, banyak penerjemah yang menggunakan CAT Tools untuk membantu memudahkan pekerjaannya. Survei tahun 2019 oleh ProZ.com menyebut 88% penerjemah menggunakan setidaknya satu CAT Tools untuk melakukan beberapa proyek penerjemahan. Dari persentase tersebut, 93% penerjemah merasa terbantu dengan keberadaan CAT Tools.

Terdapat berbagai perangkat lunak CAT Tools yang dapat digunakan penerjemah, seperti Trados, SDLX, Transit, Metatexis, Déjà vu, Idiom, Word Fast, Wimtrad, dan masih banyak lagi. Menurut survei ProZ.com, Trados sebagai perangkat lunak CAT Tools yang paling banyak digunakan, disusul Word Fast dan memoQ.

Daftar CAT Tools yang paling banyak digunakan.
Daftar CAT Tools yang paling banyak digunakan. (ProZ.com)

Demikian penjelasan sederhana mengenai teknologi penerjemahan. MT Tools dan CAT Tools adalah contoh bahwa teknologi membuat segala kegiatan menjadi lebih mudah, termasuk dalam hal menerjemahkan semua tugas dan pekerjaan. Terjemahan yang dihasilkan pun jadi lebih akurat dan dapat dipahami.

[Total: 0 Average: 0]

Leave a Comment