Suara, Wajah, dan Chat Bisa Dipalsukan, Lalu Kita Percaya Siapa?

Selama ini kita punya kebiasaan sederhana dalam mempercayai orang di ruang digital. Kalau suaranya familiar, kita cenderung percaya. Kalau wajahnya kelihatan benar, kita cenderung percaya. Kalau gaya chat-nya mirip, kita cenderung percaya.

AI pelan-pelan merusak tiga fondasi itu.

Suara bisa ditiru. Wajah bisa digerakkan. Chat bisa dibuat menyerupai gaya seseorang. Bahkan kombinasi ketiganya bisa dipakai untuk membangun satu ilusi yang terasa sangat nyata: seolah-olah orang yang kita kenal benar-benar sedang berbicara kepada kita.

Masalahnya bukan cuma penipuan jadi lebih canggih. Masalahnya, intuisi sosial manusia menjadi semakin mudah dieksploitasi.

Di Indonesia, ini serius. Banyak keputusan sehari-hari bergerak lewat WhatsApp, voice note, video call, DM, grup keluarga, grup kantor, dan instruksi informal. Dari transfer uang, approval invoice, pembagian dokumen, sampai keputusan bisnis kecil, banyak yang berjalan bukan lewat sistem resmi, tetapi lewat rasa percaya.

Rasa Familiar Dulu Aman, Sekarang Jadi Celah

Manusia didesain untuk mengenali pola. Kita mengenali suara ibu, gaya chat teman, intonasi atasan, cara ketik pasangan, dan ekspresi wajah orang yang dekat dengan kita. Ini bagian dari kehidupan sosial yang normal.

Namun di ruang digital berbasis AI, rasa familiar bisa diproduksi.

Voice cloning dapat membuat suara sintetis yang terdengar mirip. Deepfake dapat membuat wajah bergerak seolah sedang bicara. Generative AI dapat meniru gaya tulisan seseorang jika pelaku punya cukup contoh. Chatbot dapat menjawab secara kontekstual, sabar, dan meyakinkan.

Akibatnya, pertanyaan lama seperti “ini beneran dia atau bukan?” tidak bisa dijawab hanya dengan telinga, mata, atau feeling.

Di masa lalu, kita mungkin bisa bilang, “gue kenal suara dia.” Sekarang kalimat itu tidak cukup kuat sebagai alat verifikasi.

Spoofing Identitas Tidak Harus Sempurna untuk Berbahaya

Orang sering membayangkan deepfake atau voice cloning harus sangat sempurna untuk berhasil. Padahal tidak. Serangan identitas sintetis hanya perlu cukup meyakinkan dalam momen tertentu.

Kalau target sedang panik, sedang meeting, sedang menyetir, sedang mengejar deadline, atau sedang mengurus masalah keluarga, standar verifikasinya turun. Pesan yang tidak sempurna tetap bisa berhasil jika konteksnya tepat.

Misalnya, ada suara yang terdengar seperti anak meminta uang karena “lagi darurat”. Ada chat dari nomor baru yang mengaku sebagai atasan dan meminta dokumen. Ada video call singkat yang terlihat seperti kolega, lalu koneksi tiba-tiba buruk. Ada pesan dari “admin bank” yang memakai nama lengkap dan detail transaksi palsu.

Pelaku tidak perlu membangun ilusi selama satu jam. Kadang cukup tiga puluh detik untuk membuat korban mengambil keputusan buruk.

AI tidak hanya membuat konten palsu. AI membuat momen percaya palsu.

Masalah Ini Masuk ke Rumah, Kantor, Sekolah, dan Politik

Di rumah, voice cloning bisa dipakai untuk skenario keluarga darurat. Di kantor, impersonation bisa dipakai untuk fraud pembayaran, pencurian dokumen, atau pengambilalihan akun. Di sekolah, wajah dan suara anak bisa disalahgunakan untuk bullying, pemerasan, atau konten sintetis non-konsensual. Di politik, potongan audio atau video palsu bisa memicu kemarahan publik sebelum klarifikasi sempat menyebar.

Itu sebabnya isu ini tidak bisa hanya dibaca sebagai “teknologi deepfake”. Ini isu keamanan sosial.

Komdigi telah menyoroti AI sebagai senjata siber dan mengingatkan kenaikan ancaman deepfake. OJK juga sudah memperingatkan masyarakat soal penipuan yang menggunakan AI. Sementara laporan keamanan global seperti Microsoft Digital Defense Report dan ENISA Threat Landscape menunjukkan AI makin masuk ke rantai serangan siber, dari social engineering sampai manipulasi identitas.

Kalau suara, wajah, dan chat bisa dipalsukan, maka pertahanan yang hanya bertumpu pada “kenal orangnya” menjadi terlalu rapuh.

Kepercayaan Harus Pindah dari Orang ke Prosedur

Ini bagian yang terasa dingin, tapi penting: di banyak situasi sensitif, kita tidak bisa lagi hanya percaya pada orang. Kita harus percaya pada prosedur.

Kalau ada permintaan transfer, harus ada verifikasi kanal kedua. Kalau ada perubahan rekening vendor, harus ada callback ke kontak resmi yang sudah tersimpan sebelumnya. Kalau ada permintaan dokumen rahasia, harus lewat sistem resmi. Kalau ada instruksi dari atasan, harus ada approval yang tercatat. Kalau ada pesan dari nomor baru, jangan langsung percaya hanya karena gaya bahasanya mirip.

Prosedur bukan tanda tidak percaya kepada orang. Prosedur adalah cara melindungi orang dari pemalsuan identitas.

Masalahnya, banyak budaya kerja Indonesia masih menganggap verifikasi sebagai ribet, tidak enak, atau terlalu formal. Padahal justru kultur “nggak enakan” itu yang sering dieksploitasi social engineering.

Di era AI, sopan santun digital harus ditambah satu prinsip: verifikasi bukan penghinaan.

Kita Butuh Bahasa Baru: Provenance, Authentication, dan Audit Trail

Ruang digital ke depan tidak cukup hanya bicara soal konten. Kita harus bicara asal-usul konten.

Apakah file ini punya metadata yang jelas? Apakah video ini berasal dari akun resmi? Apakah audio ini bisa diverifikasi? Apakah pesan ini datang dari kanal yang benar? Apakah transaksi ini punya jejak approval? Apakah dokumen ini bisa dilacak versinya?

Di level global, perdebatan tentang content provenance, watermarking, dan autentikasi media makin kuat karena AI membuat batas realitas digital makin kabur. Tetapi masyarakat umum tidak harus menunggu semua standar teknis matang. Di level praktis, provenance berarti satu hal: jangan hanya melihat isi pesan, lihat asal dan jalurnya.

Konten yang terlihat meyakinkan tetapi datang dari jalur tidak jelas harus diperlakukan sebagai risiko.

Orang Biasa Tidak Bisa Menjadi Detektor Deepfake Berjalan

Sering ada tips yang beredar: perhatikan gerak bibir, cek bayangan, dengarkan jeda suara, lihat ekspresi mata. Tips seperti ini boleh diketahui, tetapi jangan dijadikan benteng utama.

Kenapa? Karena kualitas AI akan terus membaik, sementara konteks konsumsi konten sering buruk. Video dilihat di layar kecil. Audio dikompres. Orang sedang buru-buru. Jaringan tidak stabil. Platform memotong kualitas. Banyak deepfake tidak perlu lolos uji forensik, cukup lolos uji perhatian manusia.

Kalau publik dipaksa menjadi detektor konten palsu secara manual, kita sedang menaruh beban terlalu besar pada individu.

Yang lebih realistis adalah membangun kebiasaan verifikasi sederhana dan sistemik. Untuk urusan uang, data, reputasi, dan akses, jangan ambil keputusan dari satu bukti digital saja.

Institusi Harus Punya Playbook Pemalsuan Identitas

Perusahaan, sekolah, kampus, komunitas, media, dan lembaga publik perlu membuat playbook sederhana.

Apa yang dilakukan kalau ada akun palsu mengatasnamakan institusi? Apa langkah kalau ada voice note palsu dari pimpinan? Siapa yang memberi klarifikasi resmi? Kanal mana yang digunakan? Bagaimana cara mendokumentasikan bukti? Bagaimana melindungi korban agar tidak ikut disalahkan?

Banyak institusi baru panik setelah skandal terjadi. Padahal respons awal sangat menentukan. Dalam kasus synthetic media, keterlambatan klarifikasi bisa membuat publik terlanjur percaya. Lebih buruk lagi, korban bisa kehilangan kontrol atas reputasinya.

Trust digital bukan cuma pencegahan. Trust digital juga kemampuan merespons ketika kepercayaan diserang.

Anak Muda Lebih Fasih Digital, Tapi Tidak Otomatis Lebih Aman

Ada mitos bahwa anak muda pasti lebih kebal terhadap manipulasi digital karena mereka lahir dengan internet. Tidak selalu.

Anak muda mungkin lebih cepat memahami platform, meme, tren, dan fitur. Tetapi itu tidak otomatis membuat mereka tahan terhadap pemalsuan identitas, tekanan sosial, FOMO, pemerasan emosional, atau manipulasi visual.

Bahkan, karena banyak interaksi sosial mereka terjadi secara digital, risiko identitas sintetis bisa terasa lebih dekat. Screenshot palsu, chat palsu, voice note palsu, foto editan, dan video manipulatif bisa merusak relasi sosial dalam hitungan jam.

Kemampuan memakai platform tidak sama dengan kemampuan membaca risiko.

Kesimpulan: Kita Percaya pada Sistem yang Bisa Diuji

Ketika suara, wajah, dan chat bisa dipalsukan, jawaban untuk “lalu kita percaya siapa?” bukan “jangan percaya siapa pun”. Itu terlalu paranoid dan tidak realistis.

Jawaban yang lebih dewasa adalah: percaya pada sistem yang bisa diuji.

Percaya pada kanal resmi. Percaya pada prosedur verifikasi. Percaya pada audit trail. Percaya pada identitas yang bisa dikonfirmasi lewat lebih dari satu jalur. Percaya pada organisasi yang punya respons cepat ketika namanya dicatut. Percaya pada bukti yang punya asal-usul jelas.

Isu ini berada di jantung Cybersecurity & Trust. Ia juga terhubung dengan Data, Privacy & Digital Rights, AI Governance, dan Consumer AI & Everyday Technology.

AI membuat pemalsuan semakin murah. Maka kepercayaan harus dibuat lebih mahal: lebih sulit dipalsukan, lebih mudah diverifikasi, dan lebih cepat dipulihkan ketika diserang.