Text adalah salah satu sumber unstructured data yang paling besar, karena sebagian besar informasi tersimpan dalam text, baik text dalam berbagai filetype (doc txt pdf dll) maupun web text (html). Dewasa ini semakin sering dilakukan riset yang melibatkan text, dan bidang ilmu komputer yang melibatkan text diantaranya adalah Natural Language Processing, Text (Web) Mining, ataupun Information Retrieval.
Berikut adalah beberapa fungsi text (string) dalam PHP yang akan sering digunakan apabila anda berkutat dengan penelitian yang melibatkan text processing.
1. Menambahkan slash (\) dalam string –> addslashes.
This is Anne\’s book.
Kenapa hal ini penting? Dalam pemrosesan teks, seringkali tanda quote (‘) akan menimbulkan eror ketika dilakukan parsing terhadap text tersebut, terutama ketika kita menggunakan regular expression.
2. Memecah string dengan string –> explode.
Array
(
[0] => My
[1] => name
[2] => is
[3] => June
)
Explode akan memecah text dan membaginya ke dalam array, seperti contoh diatas, $text di-explode dengan string ” ” (spasi). Hal ini merupakan dasar dari algoritma tokenizing, yaitu memecah kalimat dalam kata – kata penyusunnya. Tokenizing akan sering sekali digunakan dalam text processing.
3. Menggabungkan array string dalam satu string –> implode.
This is a sentence
Implode, seperti terlihat dari contoh diatas (contoh : array dalam contoh di-implode / digabung dengan menggunakan string spasi), merupakan kebalikan dari fungsi no 2 (explode). Fungsi implode memiliki alias, yaitu Join.
4. Memberikan nilai MD5 dari string –> md5.
5f4dcc3b5aa765d61d8327deb882cf99
MD5 merupakan salah satu fungsi hash (kriptografi satu arah) yang cukup terkenal dan sering digunakan untuk security (meskipun sekarang sudah banyak md5 decryptor). Fungsi md5 seperti ini akan sering digunakan apabila kita membangun sebuah aplikasi yang memerlukan autentikasi (misal untuk login ke dalam sistem).
5. Menghilangkan HTML Tag dalam string –> strip_tags
June Susan June June
Sebelum kita bisa memproses text dari web (yang biasanya berbentuk hypertext / html), maka kita harus “membersihkan” tag – tag html yang ada dalam text tersebut. Disinilah fungsi strip_tags berguna. Kita bisa menghilangkan seluruh tag, ataupun mengijinkan tag tertentu untuk tetap berada dalam text (lihat contoh).
6. Menghitung panjang string –> strlen.
15
Strlen menghitung jumlah karakter (panjang) dari string, spasi, dan simbol – simbol yang ada dalam string juga akan dihitung dalam fungsi strlen.
Berikut adalah beberapa fungsi text (string) dalam PHP yang akan sering digunakan apabila anda berkutat dengan penelitian yang melibatkan text processing.
1. Menambahkan slash (\) dalam string –> addslashes.
<?php $text = "This is Anne's book."; echo addslashes($text); ?>Output :
This is Anne\’s book.
Kenapa hal ini penting? Dalam pemrosesan teks, seringkali tanda quote (‘) akan menimbulkan eror ketika dilakukan parsing terhadap text tersebut, terutama ketika kita menggunakan regular expression.
2. Memecah string dengan string –> explode.
<?php $sentence = "My name is June"; $word = explode(" ", $sentence); print_r($word); ?>Output :
Array
(
[0] => My
[1] => name
[2] => is
[3] => June
)
Explode akan memecah text dan membaginya ke dalam array, seperti contoh diatas, $text di-explode dengan string ” ” (spasi). Hal ini merupakan dasar dari algoritma tokenizing, yaitu memecah kalimat dalam kata – kata penyusunnya. Tokenizing akan sering sekali digunakan dalam text processing.
3. Menggabungkan array string dalam satu string –> implode.
<?php $arrayWord = array('This', 'is', 'a', 'sentence'); $joinString = implode(" ", $arrayWord); echo $joinString; ?>Output :
This is a sentence
Implode, seperti terlihat dari contoh diatas (contoh : array dalam contoh di-implode / digabung dengan menggunakan string spasi), merupakan kebalikan dari fungsi no 2 (explode). Fungsi implode memiliki alias, yaitu Join.
4. Memberikan nilai MD5 dari string –> md5.
<?php $string = 'password'; $stringMd5 = md5($string); echo $stringMd5; ?>Output :
5f4dcc3b5aa765d61d8327deb882cf99
MD5 merupakan salah satu fungsi hash (kriptografi satu arah) yang cukup terkenal dan sering digunakan untuk security (meskipun sekarang sudah banyak md5 decryptor). Fungsi md5 seperti ini akan sering digunakan apabila kita membangun sebuah aplikasi yang memerlukan autentikasi (misal untuk login ke dalam sistem).
5. Menghilangkan HTML Tag dalam string –> strip_tags
<?php $text = '<b>June Susan</b> <i> June June</i>'; echo strip_tags($text); echo '<br>'; echo strip_tags($text, '<i>'); // Allow tag <i> ?>Output :
June Susan June June
Sebelum kita bisa memproses text dari web (yang biasanya berbentuk hypertext / html), maka kita harus “membersihkan” tag – tag html yang ada dalam text tersebut. Disinilah fungsi strip_tags berguna. Kita bisa menghilangkan seluruh tag, ataupun mengijinkan tag tertentu untuk tetap berada dalam text (lihat contoh).
6. Menghitung panjang string –> strlen.
<?php $string = 'I am a superman'; echo strlen($string); ?>Output :
15
Strlen menghitung jumlah karakter (panjang) dari string, spasi, dan simbol – simbol yang ada dalam string juga akan dihitung dalam fungsi strlen.
Tidak ada komentar:
Posting Komentar