Definisi dan Pengertian Partial Failure

Posted on

Pada satu waktu, banyak elemen dari sistem terdistribusi mungkin gagal. Jika sistem terdistribusi dirancang dengan benar, kegagalan ini memiliki sedikit visibilitas bagi pelanggan sistem. Properti ini disebut ketersediaan tinggi dan biasanya diwujudkan dengan replikasi layanan melalui beberapa komponen dan dengan duplikasi informasi.

Banyak protokol jaringan terdistribusi, seperti UDP, memiliki asumsi dasar bahwa ada kegagalan dan paket hilang. Sesuai desain, protokol secara otomatis pulih dari banyak kelas kegagalan. Pemulihan ini terjadi hampir transparan bagi pelanggan. Dari fungsionalitas calon pelanggan tidak hilang meskipun waktu respons mungkin lebih lambat.

Jika sistem terdistribusi secara bertahap kehilangan kemampuannya karena semakin banyak elemen dalam sistem yang gagal, hal itu dikatakan menunjukkan degradasi yang anggun. Hanya karena beberapa layanan tidak tersedia tidak berarti bahwa pekerjaan yang bermanfaat tidak dapat diselesaikan. Sebuah jurnal atau file log mungkin dibuat untuk mengumpulkan perubahan ketika pada akhirnya layanan tersedia.

Akhirnya, suatu titik tercapai di mana begitu banyak elemen gagal sehingga sistem terdistribusi akan larut ke partisi individu. Pengelompokan ulang partisi biasanya diselesaikan dengan bantuan algoritma pemungutan suara setelah kuorum ditetapkan.

Banyak aplikasi sistem terdistribusi dapat mentolerir kegagalan satu titik dari layanan yang mendasarinya. Ini terjadi ketika salah satu titik dalam sistem bisa gagal, namun aplikasi, secara keseluruhan, terus berfungsi dengan benar. Ini disebut brankas satu titik. Tentu saja, dengan cara yang sama, sebuah aplikasi bisa menjadi dua titik-kegagalan aman. Secara umum, karena jumlah kegagalan yang dapat ditoleransi meningkat dalam suatu aplikasi, demikian pula kompleksitas dan biaya sistem untuk mendukung aplikasi semacam itu.

Aplikasi yang tidak pernah gagal selama periode waktu yang lama karena kesalahan perangkat keras adalah toleransi kesalahan. Perangkat keras toleran kesalahan biasanya mencakup redundansi tiga kali lipat untuk setiap komponen dengan pemungutan suara dan unit pembanding untuk menetapkan hasil dan untuk mendeteksi potensi kesalahan. Setiap unit memiliki tiga salinan identik yang masing-masing menjalankan perangkat lunak yang persis sama. Hasil keluaran diberikan ke unit pembanding. Jika ketiga unit memiliki output yang sama, hasilnya dianggap benar. Jika dua dari tiga unit setuju tetapi unit ketiga berbeda, unit ketiga dianggap salah dan hasil dari dua unit umum disajikan sebagai jawabannya.

Leave a Reply

Your email address will not be published. Required fields are marked *