MAKALAH INTERNET, SERVER, PROTOKOL, AND SEARCH ENGINE Oleh FITRIA DWI ANGGRAENI (121710201007) LATHIFAN MURTI SARI (121710201029) AMINATU ZHUHROH (121710201031) PRADITA DEWI HIDAYAH (121710201033) JURUSAN TEKNIK PERTANIAN FAKULTAS TEKNOLOGI HASIL PERTANIAN UNIVERSITAS JEMBER Desember 2013 BAB 1. INTERNET 1.1 Definisi Internet Dari segi ilmu pengetahuan Interconnected Network (Internet) merupakan sebuah perpustakaan besar yang didalamnya terdapat jutaan (bahkan milyaran) informasi atau data yang dapat berupa text, grapich, audio, maupun animasi dan lain-lain dalam bentuk media elektronik. Dari segi komunikasi internet merupakan sarana yang efisien dan efektif untuk melakukan pertukaran informasi jarak jauh maupun didalam lingkungan perkantoran. 1.2 Sejarah Internet Departemen Pertahanan Amerika, U.S. Defense Advanced Research Projects Agency (DARPA) pada tahun 1969 memutuskan untuk mengadakan riset tentang bagaimana caranya menghubungkan sejumlah komputer sehingga membentuk jaringan organik. Program riset ini dikenal dengan nama ARPANET. Pada 1970, sudah lebih dari 10 komputer yang berhasil dihubungkan satu sama lain sehingga mereka bisa saling berkomunikasi dan membentuk sebuah jaringan. Tahun 1972, Roy Tomlinson berhasil menyempurnakan program e-mail yang ia ciptakan setahun yang lalu untuk ARPANET. Program e-mail ini begitu mudah sehingga langsung menjadi populer. Pada tahun yang sama, icon @ juga diperkenalkan sebagai lambang penting yang menunjukkan “at” atau “pada”. Tahun 1973, jaringan komputer ARPANET mulai dikembangkan ke luar Amerika Serikat. Komputer University College di London merupakan komputer pertama di luar Amerika yang menjadi anggota jaringan ARPANET. Pada tahun yang sama, dua orang ahli komputer yakni Vinton Cerf dan Bob Kahn mempresentasikan sebuah gagasan yang lebih besar, yang menjadi cikal bakal pemikiran internet. Ide ini dipresentasikan untuk pertama kalinya di Universitas Sussex. Tanggal 26 Maret 1976 merupakan hari bersejarah berikutnya dimana, Ratu Inggris berhasil mengirimkan e-mail dari Royal Signals and Radar Establishment di Malvern. Setahun kemudian, sudah lebih dari 100 komputer yang bergabung di ARPANET membentuk sebuah jaringan atau network. Pada 1979, Tom Truscott, Jim Ellis, dan Steve Bellovin, menciptakan newsgroups pertama yang diberi nama USENET. Tahun 1981, France Telecom menciptakan gebrakan dengan meluncurkan telpon televisi pertama, dimana orang bisa saling menelpon sambil berhubungan dengan video link. Karena komputer yang membentuk jaringan semakin hari semakin banyak, maka dibutuhkan sebuah protokol resmi yang diakui oleh semua jaringan. Pada tahun 1982, dibentuk Transmission Control Protocol atau TCP dan Internet Protokol atau IP yang kita kenal semua. Sementara itu di Eropa, muncul jaringan komputer tandingan yang dikenal dengan Eunet, yang menyediakan jasa jaringan komputer di negara-negara Belanda, Inggris, Denmark, dan Swedia. Jaringan Eunet menyediakan jasa e-mail dan newsgroup USENET. Untuk menyeragamkan alamat di jaringan komputer yang ada, maka pada tahun 1984 diperkenalkan sistem nama domain, yang kini kita kenal dengan DNS atau Domain Name System. Komputer yang tersambung dengan jaringan yang ada sudah melebihi 1000 komputer. Pada 1987, jumlah komputer yang tersambung ke jaringan melonjak 10 kali lipat manjadi 10.000 lebih. Tahun 1988, Jarko Oikarinen dari Finland menemukan dan sekaligus memperkenalkan IRC atau Internet Relay Chat. Setahun kemudian, jumlah komputer yang saling berhubungan kembali melonjak 10 kali lipat dalam setahun. Tak kurang dari 100.000 komputer kini membentuk sebuah jaringan. Tahun 1990 adalah tahun yang paling bersejarah, ketika Tim Berners Lee menemukan program editor dan browser yang bisa menjelajah antara satu komputer dengan komputer yang lainnya, yang membentuk jaringan itu. Program inilah yang disebut www, atau World Wide Web. Tahun 1992, komputer yang saling tersambung membentuk jaringan sudah melampaui sejuta komputer dan di tahun yang sama muncul istilah surfing the internet. Tahun 1994, web internet telah tumbuh menjadi 3000 alamat halaman dan untuk pertama kalinya virtualshopping atau e-retail muncul di internet. Di tahun yang sama, Yahoo! dan Netscape Navigator 1.0. 1.3 Jaringan Internet Teknologi internet saat ini semakin berkembang pesat. Internet menggunakan jaringan computer yang bisa dikategorikan sebagai WAN, yakni bisa menghubungkan berjuta computer di seluruh dunia tanpa batas Negara, dimana setiap orang yang menggunakan computer dapat bergabung kedalam jaringan internet dengan hanya melakukan koneksi ke penyedia layanan internet (Internet Service Provider/ ISP), seperti Telkom speedy, indosatNet atau Smartfren. Internet dapat diterjemahkan sebagai international networking (jaringan internasional), karena menghubungkan komnputer secara internasional, atau sebagai internet working (jaringan antar jaringan) yang menghubungkan berjuta jaringan di seluruh dunia. Gambar 1. Koneksi ke Internet Internet dimulai ketika Department of Defense USA membangun sebuah jaringan computer yang diberi nama ARPANET (Advance Research Project Agency Network) dengan tujuan untuk menghubungkan beberapa computer yang berada di universitas untuk melakukan riset militer terutama untuk membangun jaringan komunikasi computer yang mampu bertahan terhadap serangan nuklir. Semakin tahun jaringan ini mangalami perkembangan, hingga pada tahun 1983 jaringan ARPANET dibagi dua menjadi DARPANET (Defance Arpanet) dan MILNET (Military Network). Topologi internet pada dasarnya adalah mesh-topology yang menghubungkan banyak jenis jaringan melalui system packet-switching. Badan usaha komersil menyediakan layanan akses dengan menyediakan koneksi dari computer pengguna ke internet, badan ini disebut sebagai penyedia akses internet atau ISP. Beberapa ISP yang terkenal didunia adalah America Online (AOL), Australia Ounline, Compuserve, Genie, dan Prodigy. Di Indonesia ada TelkomNet, WasantaraNet, InterNux, dan sebagainya. ISP mnyediakan koneksi dial-up melalui modem telepon. Koneksi wireless melalui antenna WLAN, atau koneksi ADSL melalui telepon. Protocol koneksi yang digunakan adalah SLIP (Serial Line Interface Protocol) atau PPP (Point to Point Protocol), dimana koneksi SLIP biasanya lebih lambat dari PPP. Secara logis jaringan internet dibagi kedalam beberapa domain, yang menurut standart IPv4 (Internet Protocol version 4) diidentifikaso melalui nomor IP 32 bit atau 4 angka biner yang dipisahkan dengan titik (seperti 192.168.10.25). Tipe domain standart antara lain: a. .com = organisasi komersil b. .edu = institusi pendidikan di Amerika c. .goy = institusi pemerintah d. .mil = organisasi militer e. .net = penyedia akses jaringan f. .org = organisasi non profit Domain juga dibagi berdasarkan Negara, misalnya: a) .au = Australia b) .ca = Kanada c) .id = Indonesia d) .jp = Jepang e) .my = Malaysia f) .sw = Swedia g) .th = Thailand BAB 2. SERVER 2.1 Pengertian Server adalah sebuah sistem komputer yang menyediakan jenis layanan tertentu dalam sebuah jaringan komputer. Suatu jaringan komputer dengan banyak komputer memerlukan suatu server yang bertugas untuk menyediakan layanan yang dibutuhkan oleh client. Server ini didukung dengan prosesor yang bersifat scalable dan RAM yang besar, dan juga dilengkapi dengan sistem operasi khusus, yang disebut sebagai sistem operasi jaringan. Server ini juga menjalankan perangkat lunak administratif yang mengontrol akses terhadap jaringan dan sumber daya yang terdapat di dalamnya contoh sepertihalnya berkas atau pencetak, dan memberikan akses kepada stasiun kerja anggota jaringan. Server sampai saat ini memiliki beberapa macam jenis. Dari berbagai macam jenis server tersebut memiliki kegunaan dan tugasnya masing – masing. Dan setiap jenis server tersebut bisa dijadikan satu mesin. Jadi satu komputer server bisa melayani berbagai servis atau layanan. 2.2 Macam-macam Server Beserta Fungsinya Beberapa macam jenis beserta fungsi server tersebut adalah sebagai berikut. a) Fax Server Fax server digunakan untuk melayani servis fax bagi client. Dengan adanya server fax ini. Segala permintaan pengiriman fax maupun menerima fax akan melalui server fax ini. Server fax ini juga dilengkapi dengan modem yang mendukung fungsi fax. b) FTP Server Server ini mempunyai layanan protokol FTP. Artinya dengan adanya server FTP ini, segala permintaan FTP (FTP merupakan protokol untuk layanan transfer data) akan terlaksana. c) Mail Server Mail server mempunyai peran untuk melayani client dalam hal mail (surat). Surat dalam hal ini, client bisa mengirimkan pesan ke client yang lain, yang dimana surat tersebut disimpan dalam server mail itu juga. Selain sebagai tempat untuk menyimpan surat, server mail juga menyediakan layanan pelengkap mail servis seperti web interface untuk memudahkan client menulis surat dan mengorganisir surat yang dipunya client. d) Database Server Server database, seperti namanya. Server ini melayani servis bagi client yang membutuhkan layanan penyimpanan database. Dalam server database tersebut, bisa berisi ratusan ataupun ribuan database dari banyak user. Biasanya database tersebut dikelompokkan atau disimpan per user yang memakai layanan database tersebut. Agar tidak terjadinya pencurian data. e) Proxy Server Proxy server, bisa digunakan untuk memperkuat security pada sebuah jaringan. Server ini bisa digunakan untuk memfilter permintaan servis masuk maupun keluar dari sebuah client. Dengan adanya proxy server ini, kita bisa memblock suatu IP agar bisa berkomunikasi misalnya. f) Web Server Server ini merupakan server yang mungkin tidak aneh lagi didengar. Situs seperti search engine, blog, website dll pasti membutuhkan web server agar file – file web seperti .html .php .asp bisa diproses terlebih dahulu dalam web server sebelum fule tersebut dikirimkan ke client. Web server melayani request servis dengan protokol HTTP, dan ada juga IMAP ataupun FTP. g) Telnet Server Merupakan server yang digunakan untuk melayani servis Telnet. Dengan adanya server ini, kita bisa melakukan remote komputer yang kita inginkan. Sebelum kita meremote komputer, kita masuk dulu dalam sistem login server telnet ini. Kemudian permintaan telnet diteruskan ke komputer tujuan yang diminta oleh client. h) File Server File server bisa berarti komputer yang digunakan untuk menampung data – data yang dimiliki oleh sejumlah client. Kapasitas penyimpanan server tersebut juga tergantung dari kapasitas HDD yang dimiliki oleh server tersebut. i) Game Server Game server merupakan server yang digunakan untuk pusat untuk menghubungkan antar pemain (client) dengan pemain yang lainnya. Game server ini selain merupakan server tersendiri, bisa juga didirikan dari komputer client yang bermain game tersebut. j) DNS Server DNS server mempunyai kegunaan untuk servis DNS. DNS berguna untuk menerjemahkan alamat domain sebuah komputer ke dalam bentuk IP. Oleh sebab itu jika kita tidak menentukan DNS server pada settingan IP Address, maka kita akan kesulitan untuk membuka situs seperti Google, karena alamat google tersebut harus diterjemahkan dulu ke dalam bentuk IP address sebelum komputer kita bisa terkoneksi ke server google tersebut.. Sedangkan alamat IP server dns belum ditentukan oleh kita. k) Print Server Server ini bisa digunakan untuk pusat layanan percetakan (print) bagi client. Dengan adanya server ini, segala aktivitas “print” bisa dilakukan secara bersama dan menghemat biaya hardware karena meskipun terdapat satu printer, printer tersebut bisa digunakan oleh banyak komputer. l) Application Server Dalam fungsinya, server ini merupakan komputer server yang digunakan untuk menjalankan suatu software applikasi. m) Streaming Media Server Server ini melayani servis streaming data media seperti musik, video. Servis ini memungkinkan kita dapat mengakses sebuah konten tanpa kita mendownloadnya terlebih dahulu. n) Home Server Server ini merupakan server yang khusus bagi pengguna rumah yang membutuhkan layanan seperti home entertainment. Komputer ini bisa juga ditambah layanan servis lainnya seperti printing servis, web servis, maupun file servis sebagai backup data. Sehingga komputer ini memiliki berbagai fungsi. 2.3 Fungsi Server Secara Umum Fungsi server secara umum yaitu: 1. Menyimpan aplikasi dan database yang dibutuhkan oleh computer yang terhubung 2. Menyediakan fitur keamanan computer 3. Melindungi semua computer terhubung menggunakan firewall 4. Menyediakan IP Address untuk mesin computer terhubung jaringan. Sebuah alamat IP adalah nomor unik dalam format yang xxx, dimana x berupa nomor 1 sampai 3 digit, yang digunakan untuk mengenal setiap komputer dalam jaringan. BAB 3. PROTOKOL 3.1 Pengertian Protokol adalah sebuah aturan atau standar yang mengatur atau mengijinkan terjadinya hubungan, komunikasi, dan perpindahan data antara dua atau lebih titik komputer. Protokol dapat diterapkan pada perangkat keras, perangkat lunak atau kombinasi dari keduanya. Pada tingkatan yang terendah, protokol mendefinisikan koneksi perangkat keras. Protocol digunakan untuk menentukan jenis layanan yang akan dilakukan pada internet Dalam hukum internasional dan hubungan internasional, sebuah protokol adalah sebuah perjanjian atau persetujuan internasional yang menambah perjanjian atau persetujuan internasional sebelumnya. 3.2 Macam-macam Protokol Berikut adalah macam-macam dari protokol:. a) TCP/IP (Transmission Control Protocol/Internet Protocol) Adalah standar komunikasi data yang digunakan oleh komunitas internet dalam proses tukar-menukar data dari satu komputer ke komputer lain di dalam jaringan Internet. Protokol ini tidaklah dapat berdiri sendiri, karena memang protokol ini berupa kumpulan protokol (protocol suite). Protokol ini juga merupakan protokol yang paling banyak digunakan saat ini. Data tersebut diimplementasikan dalam bentuk perangkat lunak (software) di sistem operasi. Istilah yang diberikan kepada perangkat lunak ini adalah TCP/IP stack. Protokol TCP/IP dikembangkan pada akhir dekade 1970-an hingga awal 1980-an sebagai sebuah protokol standar untuk menghubungkan komputerkomputer dan jaringan untuk membentuk sebuah jaringan yang luas (WAN). TCP/IP merupakan sebuah standar jaringan terbuka yang bersifat independen terhadap mekanisme transport jaringan fisik yang digunakan, sehingga dapat digunakan di mana saja. Protokol ini menggunakan skema pengalamatan yang sederhana yang disebut sebagai alamat IP (IP Address) yang mengizinkan hingga beberapa ratus juta komputer untuk dapat saling berhubungan satu sama lainnya di Internet. Protokol ini juga bersifat routable yang berarti protokol ini cocok untuk menghubungkan sistem-sistem berbeda (seperti Microsoft Windows dan keluarga UNIX) untuk membentuk jaringan yang heterogen. b) UDP ( User Datagram Protokol) UDP, singkatan dari User Datagram Protocol, adalah salah satu protokol lapisan transpor TCP/IP yang mendukung komunikasi yang tidak andal (unreliable), tanpa koneksi (connectionless) antara host-host dalam jaringan yang menggunakan TCP/IP. Protokol ini didefinisikan dalam RFC 768. c) Domain Name System (DNS) Domain Name System (DNS) adalah distribute database system yang digunakan untuk pencarian nama komputer (name resolution) di jaringan yang mengunakan TCP/IP (Transmission Control Protocol/Internet Protocol). DNS biasa digunakan pada aplikasi yang terhubung ke Internet seperti web browser atau e-mail, dimana DNS membantu memetakan host name sebuah komputer ke IP address. d) Point-to-Point Protocol Point-to-Point Protocol (sering disingkat menjadi PPP) adalah sebuah protokol enkapsulasi paket jaringan yang banyak digunakan pada wide area network (WAN). Protokol ini merupakan standar industri yang berjalan pada lapisan data-link dan dikembangkan pada awal tahun 1990-an sebagai respons terhadap masalah-masalah yang terjadi pada protokol Serial Line Internet Protocol (SLIP), yang hanya mendukung pengalamatan IP statis kepada para kliennya. Dibandingkan dengan pendahulunya (SLIP), PPP jauh lebih baik, mengingat kerja protokol ini lebih cepat, menawarkan koreksi kesalahan, dan negosiasi sesi secara dinamis tanpa adanya intervensi dari pengguna. Selain itu, protokol ini juga mendukung banyak protokol-protokol jaringan secara simultan. PPP didefinisikan pada RFC 1661 dan RFC 1662. e) Serial Line Internet Protocol Disingkat dengan SLIP. Sebuah protokol yang memungkinkan pemindahan data IP melalui saluran telepon. Alat bantu lainnya dalam SLIP adalah PPP yang mendeteksi kesalahan dan konfigurasi. Sistem ini memerlukan satu komputer server sebagai penampungnya, dan secara perlahan-lahan akan digantikan oleh standar PPP yang memiliki kecepatan proses lebih tinggi. f) Internet Control Message Protocol (ICMP) Adalah salah satu protokol inti dari keluarga. ICMP berbeda tujuan dengan TCP dan UDP dalam hal ICMP tidak digunakan secara langsung oleh aplikasi jaringan milik pengguna. salah satu pengecualian adalah aplikasi ping yang mengirim pesan ICMP Echo Request (dan menerima Echo Reply) untuk menentukan apakah komputer tujuan dapat dijangkau dan berapa lama paket yang dikirimkan dibalas oleh komputer tujuan. protokol internet. ICMP utamanya digunakan oleh sistem operasi komputer jaringan untuk mengirim pesan kesalahan yang menyatakan, sebagai contoh, bahwa komputer tujuan tidak bisa dijangkau. g) POP3 (Post Office Protocol) POP3 adalah kepanjangan dari Post Office Protocol version 3, yakni protokol yang digunakan untuk mengambil email dari email server. Protokol POP3 dibuat karena desain dari sistem email yang mengharuskan adanya email server yang menampung email untuk sementara sampai email tersebut diambil oleh penerima yang berhak. Kehadiran email server ini disebabkan kenyataan hanya sebagian kecil dari komputer penerima email yang terus-menerus melakukan koneksi ke jaringan internet. h) IMAP (Internet Message Access Protocol) IMAP (Internet Message Access Protocol) adalah protokol standar untuk mengakses/mengambil e-mail dari server. IMAP memungkinkan pengguna memilih pesan e-mail yang akan ia ambil, membuat folder di server, mencari pesan e-mail tertentu, bahkan menghapus pesan e-mail yang ada. Kemampuan ini jauh lebih baik daripada POP (Post Office Protocol) yang hanya memperbolehkan kita mengambil/download semua pesan yang ada tanpa kecuali. i) SMTP (Simple Mail Transfer Protocol) Adalah suatu protokol yang umum digunakan untuk pengiriman surat elektronik atau email di Internet. Protokol ini gunakan untuk mengirimkan data dari komputer pengirim surat elektronik ke server surat elektronik penerima. j) HTTP (Hypertext Transfer Protocol) HTTP (Hypertext Transfer Protocol) suatu protokol yang digunakan oleh WWW (World Wide Web). HTTP mendefinisikan bagaimana suatu pesan bisa diformat dan dikirimkan dari server ke client. HTTP juga mengatur aksi-aksi apa saja yang harus dilakukan oleh web server dan juga web browser sebagai respon atas perintah-perintah yang ada pada protokol HTTP ini. Contohnya bila kita mengetikkan suatu alamat atau URL pada internet browser maka web browser akan mengirimkan perintah HTTP ke web server. Web server kemudian akan menerima perintah ini dan melakukan aktivitas sesuai dengan perintah yang diminta oleh web browser. Hasil aktivitas tadi akan dikirimkan kembali ke web browser untuk ditampilkan kepada kita. k) HTTPS HTTPS adalah versi aman dari HTTP, protokol komunikasi dari World Wide Web. Ditemukan oleh Netscape Communications Corporation untuk menyediakan autentikasi dan komunikasi tersandi dan penggunaan dalam komersi elektris. Selain menggunakan komunikasi plain text, HTTPS menyandikan data sesi menggunakan protokol SSL (Secure Socket layer) atau protokol TLS (Transport Layer Security). Kedua protokol tersebut memberikan perlindungan yang memadai dari serangan eavesdroppers, dan man in the middle attacks. Pada umumnya port HTTPS adalah 443. l) SSH (Sucure Shell) SSH adalah protocol jaringan yang memungkinkan pertukaran data secara aman antara dua komputer. SSH dapat digunakan untuk mengendalikan komputer dari jarak jauh mengirim file, membuat Tunnel yang terrenkripsi dan lain-lain. Protocol ini mempunyai kelebihan disbanding protocol yang sejenis seperti Telnet, FTP, Danrsh, karena SSH memiliki system Otentikasi,Otorisasi, dan ekripsinya sendiri. Dengan begitu keamanan sebuah sesi komunikasi melalui bantuan SSH ini menjadi lebih terjamin. SSH memang lebih aman dibandingkan dengan protocol sejenis, tetapi protocol SSH tatap rentan terhadap beberapa jenis serangan tertentu. Pada umumnya serangan ini ditunjukan Pada SSH versi pertama (SSH-1) yang memang memiliki tingkat keamanan yang lebih lemah daripada SSH versi kedua (SSH-2). Salah satu serangan pada SSH versi pertama adalah serangan MAN IN THE MIDDLE pada saat pertukaran kunci. Protocol SSH serta algoritma yang digunakan pada kedua versi SSH, lalu seranganserangan yang terjadi pada SSH dan bagaimana SSH mengatasinya. Untuk meningkatkan keamanan pada protocol SSH dapat dilakukan dengan cara menggunakan kartu Kriptografi untuk autentifkasi. m) Telnet (Telecommunication network) Adalah sebuah protokol jaringan yang digunakan di koneksi Internet atau Local Area Network. TELNET dikembangkan pada 1969 dan distandarisasi sebagai IETF STD 8, salah satu standar Internet pertama. TELNET memiliki beberapa keterbatasan yang dianggap sebagai risiko keamanan. 3.3 Fungsi Protokol : Secara umum fungsi protokol adalah sebagai penghubung dalam komunikasi data sehingga proses penukaran data bisa berjalan dengan baik dan benar. Secara khusus, fungsi protokol adalah sebagai berikut : a. Fragmentasi dan Re-assembly : Pembagian informasi yang dikirim menjadi beberapa paket data dari sisi pengirim. Jika telah sampai di penerima, paket data tersebut akan digabungkan menjadi paket berita yang lengkap. b. Enkapsulasi Enkapsulasi (Encaptulation) : proses pengiriman data yang dilengkapi dengan alamat, kode-kode koreksi, dan lain-lain. c. Kontrol Konektivitas : Membangun hubungan komunikasi berupa pengiriman data dan mengakhiri hubungan dari pengirim ke penerima. d. Flow Control : sebagai pengatur jalannya data dari pengirim ke penerima. e. Error Control : mengontrol terjadinya kesalahan sewaktu data dikirimkan. f. Pelayanan Transmisi : memberikan pelayanan komunikasi data yang berhubungan dengan prioritas dan keamanan data. BAB 4.SEARCH ENGINE 4.1 Pengertian Search Engine Menurut Yuhefizar (2008: 205) search engine merupakan perangkat lunak atau lebih sering disebut sebagai mesin pencari yang bekerja untuk mencari segala sumber informasi di dunia maya/internet melalui alamat-alamat website. Website search engine merupakan sebuah website yang berfungsi untuk mencari informasi yang terdapa di internet berdasarkan kriteria yang ditentukan oleh pengguna internet. Pada saat mengunjungi website, serach engine akan mencatat setiap halaman yang ada, kemudian search engine akan mengunjungi ulang untuk memastikan website yang telah terindeks masih ada atau tidak. Menurut Maryono dan Istiana (2008: 91) search engine merupakan sistem database dengan program khusus spider crawler yang dirancang untuk mengindex alamat-alamat website di internet. Pada saat mendaftarkan alamat website (URL), spider dari search engine ini akan menerima dan menganalisa URL tersebut kemudian mengcrawlnya. 1. Sejarah Search Engine Menurut Yuhefizar (2008:206) perkembangan search engine berawal dari diciptakannya perangkat lunak yang bernama Archie oleh Alan Emtage, seorang mahasiswa dari Universitas McGil, Montreal, Kanada pada tahun 1990. Perangkat lunak Archie mampu mengindeks file-file yang terdapat pada FTP server public. Ini merupakan aplikasi pertama yang digunakan untuk mencari informasi di internet, sehingga Archie dinobatkan sebagai nenek moyang search engine. Search engine berikutnya adalah Veronica (Very Easy Rodent-Oriented Net-wide Index to Computerized Archieves) dan Jughead (Jonzy’s Universal Ghoper Hierarchy Excavation And Display), yang mampu mengindeks halaman-halaman plain text yang terdapat pada server ghoper. World Wide We Wanderer merupakan aplikasi search engine pertama yang menggunakan teknologi robot dalam melakukan proses indeks halamanhalaman web yang terdapat pada web server. Aplikasi ini dirintis oeh Matthew Gray, seorang mahasiswa dari MIT. Namun aplikasi ini memnimbulkan kontroversi karena akibat dari kinerja robot ini menghabiskan bandwith yang sangat besar. Berikutnya, pada tahun 1993 Martjin Koster membuat ALIWEB (Archie-Like Indexing of the Web). ALIWEB mengizinkan pengguna internet men-submit halaman webnya untuk diindeks dengan teknologi kumpulan metadata. Beberapa aplikasi tersebut yang menginspirasi lahirnya teknologi search engine yang baru. Mulai dari munculnya website search engine webcrawler, infoseek, yaho, lycos, altavista , excite, hotbot, google, dan lainnya. Lahirnya Yahoo telah membuat penggunaan search engine meningkat. Yahoo didirikan oleh dua kandidat doctoral yaitu David Filo dan Jerry Yang dari Universitas Stanford. Kemudian disusul oleh Lycos yang merupakan sebuah proyek dari sebuah lab di Universitas Carnigie Mellon, Juli 1994 oleh Michael Maudlin. Altavista dikeluarkan Desember 1995 oleh Dihgital Equipment Corporation’s (DEC). Terakhir HotBot dibangun 20 Mei 1996 dan merupakan produk keluaran Inkomotomi Corporation yang didirikan oleh Eric Brewer dan Paul Gauthier dari Universitas California Berkeley. Google muncul pada akhir 1997, yang dirintis oleh dua mahasiswa Ph. D dari Stanford, Larry Page dan Sergey Brin (Yuhefizar, 2008: 206-207). Berikut adalah daftar perkembangan search engine yang telah diluncurkan selama 20 tahun terakhir. Tahun 1993 Search Engine Engine Tahun Search Engine Allthe Web ChaCha ALIWEB GeneKnows Guruji.com Naver Sproose 1999 WebCrawler Teoma Infoseek Vivisimo Baidu Lycos Altavista 1995 Search W3Catalog JumpStation 1994 Tahun 2000 2007 Blackle.com Powerset Exalead Daum 2003 Info.com Open Text Web 2004 Yahoo! WikiaSearch 2008 Picollator Viewzi Blueready.com 1996 1997 1998 Index Search SAPO A9.com Cuil Yahoo! Sogou Boogami Dogpile MSN Search Leapfish Inktomi Ask.com Forestle HotBot GoodSeacrh VADLO Ask Jeeves SearchMe Duck Duck Go Northem Light Wikiseek Yandex 2006 Google Quaero 2009 2010 Bing Yandex global Live Search Blekko Table 1. perkembangan search engine selama 20 tahun terakhir 4.2 Cara Kerja Search Engine Beberapa layanan search engine menggunakan sebuah program yang disebut crawler atau spider. Menurut Yuhefizar (2008: 208) search engine ini bekerja dengan tahapan sebagai berikut. a. Melakukan pencarian informasi dari halaman-halaman web yang diambil langsung dari www. b. Seacrh engine melakukan analisis terhadap informasi yang telah diproleh untuk kemudian diindekskan (misalnya kata-kata diambil dari judul, subjudul, atau meta tag). c. Penyimpanan data dalam database index oleh search engine untuk pencarian selanjutnya kemudian melakukan penyimpanan seluruh atau sebagian halaman sumber. d. Ketika pengguna mengunjungi search engine dan memasukkan keyword, search engine mencari indeks yang memberikan daftar halaman web yang paling sesuai dengan keyword yang dimaksud yang ditampilkan pada monitor. 4.3 Komponen – komponen Utama Search Engine Menurut Maryono dan Istiana (2008: 93) sebuah search engine memiliki beberapa komponen agar dapat menyediakan layanan utamanya sebagai sebuah mesin pencari informasi. Komponen tersebut antara lain : a. Web Crawler Web crawler atau web spider bertugas untuk mengumpulkan semua informasi yang ada di dalam halaman web. Web crawler bekerja secara otomatis dengan cara memberikan sejumlah alamat website untuk dikunjungi serta menyimpan semua informasi yang terkandung didalamnya. Setiap kali web crawler mengunjungi sebuah website, maka dia akan mendata semua link yang ada dihalaman yang dikunjunginya itu untuk kemudian di kunjungi lagi satu persatu. Web crawler biasa digunakan untuk membuat salinan secara sebagian atau keseluruhan halaman web yang telah dikunjunginya agar dapat diproses lebih lanjut oleh system pengindexan. Crawler dapat juga digunakan untuk proses pemeliharaan sebuah website, seperti memvalidasi kode html sebuah web, dan crawler juga digunakan untuk memperoleh data yang khusus seperti mengumpulkan alamat e-mail. b. Indexing system Indexing system bertugas untuk menganalisa halaman web yang telah tersimpan sebelumnya dengan cara mengindeks setiap kemungkinan term yang terdapat di dalamnya. Data term yang ditemukan disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Tujuan dari penyimpanan data berupa indeks adalah untuk performansi dan kecepatan dalam menemukan informasi yang relevan berdasarkan inputan user. Tanpa adanya indeks, search engine harus melakukan scan terhadap setiap dokumen yang ada didalam database. Hal ini tentu saja akan membutuhkan proses sumber daya yang sangat besar dalam proses komputasi. c. Search system Search system inilah yang berhubungan langsung dengan pengguna, meyediakan hasil pencarian informasi yang diinginkan. Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan kata pencarian biasanya dengan beberapa kata kunci, search system akan mencari data dari indeks database, data yang cocok kemudian akan ditampilkan, biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya. 4.4 Macam-Macam Search Engine Dalam perkembangannya, search engine terdapat beberapa macam yang popular di dunia antara lain sebagai berikut: 1. Google Google merupakan bagian penting dari macam-macam search engine yang paling banyak digemari orang, selain fasilitas yang beraneka ragam, Google juga menampilkan hal-hal yang mudah untuk ditelusuri. Google berdiri pada Februari 1999 dan merupakan sebuah awal akan kebutuhan orang untuk mendapatkan berbagai informasi. Kelebihan dari Google antara lain kecepatan dan kemudahan dalam mencari, lebih canggih dengan fitur yang dimilikinya, tampilan yang sederhana, Google merupakan satu-satunya mesin pencari yang memilki cache. Dengan adanya cache ini, pencari dapat menghemat waktu pencarian, karena hasil pencarian yang akan ditampilkan, dan dapat mencari segala informasi seperti gambar, berita artikel, hiburan dll. Namun Google juga memiliki kelemahan yaitu google dijadikan media oleh para spamer untuk menampilkan iklan-iklan yang tidak diperlukan. 2. Yahoo Yahoo merupakan search engine yang memiliki sebuah homepage dengan banyak informasi berita dan hiburan. Yahoo juga dilengkapi dengan fasilitas SearchScan yang secara otomatis memberi tanda alert pada pengguna bila ditemukan virus / spam dalam pencariannya. Kelebihannya yaitu memiliki carta surat menyurat yang modern, layanan fasilitasnya gratis, dan proses refreshnya cepat. Kekurangannya antara lain satu id yahoo hanya untuk yahoo, terlalu mudah untuk membuat id, dan fitur YM! kalah dengan IM dari windows, 3. Bing Bing adalah mesin pencari dari Microsoft Corporation. Bing ini mulai tersedia untuk pengguna internet sejak 3 Juni 2009. Kelebihan Bing adalah mempu mencari video, music, gambar, dan beragam format file special. Kekurangannya yaitu pencarian membutuhkan waktu yang lama dan juga pengguna sulit membedakan iklan dan bukan iklan pada halaman pencariannya. 4. MSN Search Search engine ini merupakan mesin pencari pertama yang diciptakan oleh Microsoft Inc dan berdiri pada tahun 1998. Fasilitas yang diunggulkan MSN adalah pencarian Video, Musik, Gambar dan beragam Format File. MSN merupakan mesin pencari yang langsung terformat di setiap komputer atau laptop maupun sejenisnya merupakan sebuah kemudahan bagi setiap orang untuk langsung mengunjunginya, ini juga merupakan suatu kelebihan yang dimiliki oleh MSN