Mengenal Lebih Dekat Teknik Tokenisasi dalam Melindungi Data Sensitif selain Enkripsi dan Hashing

Mochammad Ronny Ardianto & Andrew Sagitta Jauhari

Keamanan Data (Data Security)

Saat ini, kita berada di era digital yang berkembang pesat ditandai dengan kemunculan berbagai inovasi teknologi canggih secara disruptif. Hal ini menyebabkan data dapat dihasilkan dengan sangat cepat dan dimana saja, mulai dari perangkat sehari-hari seperti laptop, smartphone, dan smartwatch, hingga di cloud dan internet yang dapat menjadi medium penyebaran data dengan lebih masif. Namun, sebagian dari data tersebut bisa saja berisikan informasi sensitif, sehingga diperlukan upaya teknik pengamanan data untuk mencegah risiko ketika data tersebut terekspos. Upaya tersebut dapat dicapai dengan menerapkan keamanan data atau data security. Data security melibatkan penerapan kontrol-kontrol keamanan data dengan tujuan mencegah tindakan penyalahgunaan data, penghancuran data, dan modifikasi data baik yang disengaja maupun tidak disengaja.

Dalam konteks keamanan siber, data diklasifikasikan menjadi tiga (3) status utama, yaitu:

Data at rest – data yang disimpan pada media fisik atau digital yang tidak secara aktif sedang ditransmisikan maupun diakses.
Data in transit – data yang secara aktif berpindah antar perangkat, antar jaringan baik lokal dan internet, maupun melalui transmisi koneksi terenkripsi.
Data in use – data yang secara aktif dioperasikan oleh sistem atau user serta aktif berpindah di sepanjang infrastruktur IT. [1]

Langkah-langkah keamanan perlu diimplementasikan untuk setiap status di atas dalam upaya untuk melakukan upaya pencegahan risiko secara proaktif. Hal itu bisa dicapai dengan penerapan security control. Contoh security control terhadap setiap status tersebut antara lain sebagaimana pada tabel berikut.

Data at rest

Data in use

Data in Transit

Data encryption

Authentication

SSL/TLS

Password hashing

Data accessibility control

Email encryption (PGP, S/MIME)

Tokenization

Memory encryption

Firewalls

Masking

Identity management

Data Loss Prevention (DLP)

Data federation

Research Questions

Dari sekian banyak upaya kontrol keamanan yang disebutkan di atas, enkripsi mengambil bagian mayoritas yakni paling banyak diterapkan sebagai opsi security control di status data at rest, in use, dan in transit. Namun, pernahkah Anda bertanya-tanya apabila suatu data sudah terenkripsi, apakah data tersebut sudah sepenuhnya aman? Bagaimana jika peretas mendapatkan data terenkripsi tersebut melalui celah kerentanan pada sistem? Dan apakah data asli kita masih dijamin aman karena sudah terenkripsi? Dari pertanyaan-pertanyaan tersebut, jawaban lugasnya adalah kunci enkripsi (key) merupakan titik krusial yang memiliki peran penting di dalam rantai risiko kerentanan pada teknologi enkripsi. Kunci enkripsi berperan sebagai syarat sah pembuka informasi terhadap data asli, yang juga berisiko membuka data asli kita kepada peretas. Apabila kunci enkripsi berhasil didapatkan oleh peretas, maka data asli kita dapat mengalami kebocoran dan berisiko terhadap penyalahgunaan data. Jadi, kelemahannya adalah data terenkripsi masih memiliki keterikatan – “tied” – terhadap data aslinya.

Lalu, apakah ada teknik security control yang karakteristiknya adalah data yang termodifikasi tidak “tied” terhadap data aslinya bahkan ketika data tersebut bocor ke peretas?

Solusi-Solusi Kontrol Keamanan Data

Sebelum menjelajah lebih jauh, di artikel ini penulis akan menjelaskan secara detail beberapa contoh teknik kontrol keamanan terhadap data yang memiliki tujuan serupa dengan enkripsi, yaitu berusaha menyembunyikan informasi dari sebuah data asli. Kontrol keamanan data terpilih pada pembahasan kali ini adalah: encryption, hashing, dan tokenization.

#1 - Encryption

Enkripsi (encryption) adalah suatu proses yang bertujuan untuk mengubah informasi menjadi kode atau sandi rahasia untuk menyembunyikan makna atau artinya. Dengan menggunakan algoritma enkripsi tertentu, perusahaan dapat mengamankan data mereka dengan mengubahnya menjadi bentuk yang tidak dapat dibaca (ciphertext). Untuk mendapatkan akses terhadap informasi asli, maka penerima perlu melakukan proses dekripsi (decryption) menggunakan kunci kriptografi. [2]

Gambar 1 merupakan diagram blok yang menggambarkan cara kerja dari kriptografi enkripsi. Sebuah pesan berupa plain text yang notabenenya adalah mudah terbaca (readable), bersama dengan sebuah kunci dilakukan proses enkripsi F(k,P) menjadi cipher text (unreadable).

Gambar 2 menunjukkan proses dekripsi sebuah cipher text yang dihasilkan dari proses enkripsi. Dengan menggunakan kunci kriptografi, cipher text tersebut didekripsi F(k,C) untuk mengkonversi balik menjadi plain text.

Jenis enkripsi berdasarkan kunci kriptografinya terbagi menjadi 2, yaitu:

Symmetric encryption – Hanya satu kunci yang digunakan dalam enkripsi simetris, yang juga disebut sebagai private key, untuk melakukan proses enkripsi dan dekripsi pada data.
Asymmetric encryption – Menggunakan dua jenis kunci enkripsi yang berbeda yaitu public key dan private key pada ke-2 belah pihak. [3]

#2 - Hashing

Hashing adalah metode yang digunakan untuk menghasilkan string karakter acak dengan panjang tetap (fixed-length) – bisa pendek atau lebih panjang – terhadap suatu data atau pesan dengan menggunakan algoritma. [1]

Gambar 3 menggambarkan cara kerja hashing dengan mengkonversikan data (plain text) menggunakan hash function atau algoritma. Hasil konversi tersebut menghasilkan nilai hash yang bersifat unik dan konsisten. Jika sebuah data di-hashing dengan menggunakan algoritma yang sama, maka hasil konversi atau nilai hash-nya akan tetap sama. Namun, apabila nilai hash ingin dikembalikan menjadi data aslinya, maka tidak bisa, karena hashing merupakan teknik satu arah yang berarti data aslinya tidak dapat dikembalikan (irreversible).

#3 - Tokenization

Sejarah mengenai konsep tokenisasi berawal dari perusahaan bernama TrustCommerce yang pada tahun 2001 memperkenalkan konsep tersebut untuk melindungi informasi pembayaran rahasia kliennya, Classmates.com. [4] Rob Caulfield, pendiri TrustCommerce, memiliki pemikiran bahwa potensi risiko penyimpanan data pemegang kartu sangat besar jika terjadi pelanggaran sistem, sehingga hal ini akhirnya memantik TrustCommerce menciptakan TC Citadel® – solusi dari TrustCommerce yang dapat pelanggan gunakan untuk memakai token sebagai pengganti data pemegang kartu lalu TrustCommerce akan menangani pemrosesan pembayaran untuk merchant.

Sebelum berbicara tentang definisi tokenization di dalam penerapan kontrol keamanan terhadap data, mari kita pahami dulu terminologi mengenai token. Token adalah data yang tidak memiliki arti dan kesinambungan dengan data asli. Token bertugas sebagai placeholder terhadap data asli sehingga data tersebut tetap bisa digunakan apabila tersimpan di database dalam bentuk token. Token bersifat unik di setiap nilai yang dihasilkan dan berasal dari karakter atau angka yang acak.

Di dalam teknik pengamanan data, tokenisasi dapat diartikan sebagai proses melindungi data sensitif dengan mengganti sebagian atau semua data tersebut dengan karakter atau angka placeholder secara acak dan tidak terikat terhadap data asli yang disebut sebagai token [5]. Untuk menggunakan token sebagai pengganti data sensitif, biasanya akan dilakukan mapping antara value data asli dengan token pada sebuah database yang secure. Cara tersebut biasa disebut dengan vaulted tokenization, sehingga terdapat tambahan lapisan teknologi yaitu sebuah database.

Apabila diklasifikasikan berdasarkan tipe penerapan tokenisasi, terdapat 2 jenis teknik penerapan tokenisasi, yaitu:

a. Vaulted Tokenization. Vaulted tokenization adalah jenis tokenisasi dengan menggunakan cara konvensional yaitu menggunakan mapping antara data asli dengan token pada sebuah database yang secure. Biasanya teknik ini memiliki sifat irreversible – kondisi dimana data asli tidak bisa dikembalikan melalui token.

Gambar 4 menunjukkan hubungan antara aplikasi, tokenization server, vault database, dan application database. Aplikasi yang mengandung data sensitif akan menghubungi server tokenisasi untuk melakukan random generate token yang kemudian token tersebut di-mapping di vault DB. Setelah itu akan dihasilkan data yang telah tertokenisasi sehingga tidak mengandung data sensitif lagi. Hasil token ini kemudian akan didistribusikan kembali oleh aplikasi menuju app DB atau layanan seperti pihak ketiga.

b. Vaultless Tokenization. Vaultless tokenization merupakan teknik tokenisasi dengan tidak menggunakan database untuk menyimpan nilai pemetaan dari data sensitif. Cara ini menggunakan perangkat kriptografi melalui algoritma untuk mengubah data sensitif menjadi data non-sensitif. Sehingga aspek database akan hilang dengan metode ini, namun akan terfokus terhadap algoritma.

Gambar 5 merupakan representasi hubungan antara stack teknologi yang digunakan untuk mewujudkan vaultless tokenization. Pada gambar tersebut, aspek vault database sudah tergantikan menggunakan algoritma kriptografi. Algoritma yang biasanya digunakan untuk implementasi vaultless tokenization adalah Format Preserving Encryption (FPE) – jenis enkripsi yang mempertahankan karakteristik data aslinya. Dengan menggunakan cara ini, sifat tokenisasi yang awalnya irreversible dapat memiliki opsi reversible sebagai tambahan.