Sumber-sumber kesalahan dalam SIG dimulai sejak awal pemasukan data, pengolahan hingga pada waktu penyajian hasil. Pada prinsipnya sumber-sumber kesalahan ini dapat dikelompokkan dari kemudahan dipahaminya atau tidak. Burrough (1986) mengelompokkan sumber-sumber kesalahan yang dihubungkan dengan kemudahan untuk memahaminya yang disajikan dalam Tabel 8-3.

Kesalahan yang Mudah diketahui
Umur Data
Umumnya umur berbagai data bervariasi, karena tidak mungkin data peta dikumpulkan pada waktu yang sama. Kebanyaka institusi yang berkecimpung dalam bidang lingkungan dan perencanaan cenderung memakai data yang sudah dipublukasikan, baik dalam bentuk peta atau laporan dan dilengkapi dengan citra pengindraan jauh studi lapangan. Untuk berbagai obyek yang mempunyai sifat dinamik maka pendekatan ini tidak tepat, tetapi untuk berbagai data dasar maka hal ini tidak menjadi persoalan. Data spasial yang bersifat dinamik antara lain penggunaan lahan, sedangkan data spasial yang tidak bersifat dinamit antara lain data topografi, data tanah atau yang paling lama dalam bidang ilmu kebumian adalah data geologi.

Dalam pengertian yang luas sifat geologi berubah lebih lambat disbanding tanah, rejim air, vegetasi atau penggunaan lahan. Tetapi ada juga kemungkinan bahwa data yang tua tidak sesuai karena pada waktu pembuatannya tergantung ke system standar yang tidak sesuai lagi dengan keadaan sekarang.

Cakupan Areal Sudi
Idealnya untuk seluruh daerah studi kualitas informasi seragam. Secara umum data yang tersedia di suatu daerah baik untuk informasi individu maupun untuk berbagai tingkat informasi, di negara-negara yang sudah berkembang sekalipun, dapat dikatakan bahwa tidak ada cakupan informasi sumberdaya lahan yang lengkap pada seluruh daerah studi, kecuali untuk wilayah yang kecil yang tidak sesuai untuk tujuan tertentu. Dalam hal peta tanah misalnya, banyak Negara yang cakupan peta tanahnya terpecah-pecah pada skala antara 1:25,000 – 1:50,000. selain itu selama 30–40 tahun berjalannya fungsi survei tanah, konsep-konsep dan definisi-definisi tanah, serta cara-cara tanah dipetakan, bahkan termasuk surveyornya juga telah berganti. System administrasi peta untuk berbagai instansi juga dapat berbeda sehingga penyambungan antara lembar peta tidak dapat dilakukan.
Jika peta cakupannya tidak lengkap, maka keputusan memperbaiki harus dibuat sehingga keseragaman yang diinginkan dapat tercapai. Pilihan dapat dibuat dengan menambah data lebih banyak pada bagian yang kurang, atau menggeneralisasikan data yang lebih detil disesuaikan dengan data yang kurang detil. Perlu dicatat bahwa tidak diijinkan memperbesar skala peta yang lebih kecil untuk memenuhi cakupan wilayah, karean selain kedetilannya tidak bertambah penyajian skala baru tersebut melanggar kode etik kartografi.

Skala Peta
Skala peta merupakan ukuran perbandingan obyek yang ada di peta dengan obyek sebenarnya di lapangan secara horizontal. Skala ini merupakan ukuran kedetilan data pada pemetaan system konvensional. Kebanyakan data tanah yang disajikan dalam bentuk peta akan berkaitan dengan skala. Skala besar tidak hanya menunjukkan detil topologi tetapi juga biasanya mempunyai informasi seri-seri tanah, sedangkan peta tanah skala peta tanah 1:25,000 akan menyajikan asosiasi beberapa seri atau famili tanah.
Penting dipahami bahwa kebutuhan skala dari sumber peta harus disesuaikan dengan sasaran studi, misalnya untuk studi perencanaan wilayah lebih dikehendaki memakai data pada skala kecil dan bahkan sering lebih menyulidkan bila skala sangat besar. Walaupun dengan demikian tidak berarti bahwa penyajiannya sedemikian rupa sehingga terjadi generalisasi yang berlebihan. Mengikuti kaidah kartografi, peta skala lebih kecil seharusnya merupakan generalisasi dari peta skala lebih besar. Masih banyak praktek bahwa pemetaan pada skala kecil dibuat tersendiri, dengan pengambilan data lokasi sampel yang tidak diselaraskan dengan variabilitas area. Peta skala kecil seperti itu kekurangan detil variabilitas, atau generalisasinya melebihi dari seharusnya.
Organisasi penyediaan data terdiri dari berbagai lembaga penelitian. Misalnya peta tanah dihasilkan oleh pusat penelitian oleh pusat penelitian tanah; peta geologi oleh pusat penelitian geologi, dll. Umumnya pete – peta tersebut dihasilkan pada berbagai skala, sehingga pemakaian harus melakukan pemilihan sendiri sesuai dengan tingat ketelitian detil yag diinginkan.
Skala peta ini dalam SIG adakalanya tidak dicantumkan. Penampilan data skala dasar digambarkan pada berbagai ukuran; untuk standar GIS-raster dapat dibuat dengan ukuran yang kecil atau pun besar. Jika ingin diketahui skala biasanya akan dibuat. Dalam penyusunan bank data, hendaknya informasi awal skala direkam, sehingga pada waktu data dipakai untuk analisis maka diketahui kemungkinan penyimpangan hasilnya ataupun dapat dilakukan perbaikan sebelum dipakai.

Kerapatan Pengamatan
Kerapatan pengamatan merupakan ukuran keakuratan suatu peta, akan tetapi sering tidak dicantumkan dalam berbagai peta tematik khususnya pada peta tanah. Di Indonesia pada berbagai proyek tertentu seperti Land Resources Evaluation and Planning Project II, titik lokasi sampel pengamatan harus diletakkan pada peta khusus. Pada masa lalu hal ini telah dilakukan pada beberapa macam survei, tetapi tidak semua peta tanah mempunyai titik pengamatan ini. Juga dalam proyek pengembangan wilayah transmigrasi, sampel pengamatan ini wajib dicantumkan baik untuk pemetaan tanah ataupun untuk lokasi pengamatan air bersih atau hidrologi.
Data mengetahui kerapatan ini dapat digunakan untuk menilai keakuratan data peta tematik yang dianalisis. Dengan adanya data ini maka berbagai system perhitungan secara statistic dapat dilakukan. Untuk kepentingan pengujian keakuratan data, pemanfaatan statistika spasial akhit-akhir ini berkembang sangat pesat. Umumnya peta tematik baik di Indonesia maupun dunia, tidak menyajikan data lokasi maupun data mental pada peta, yang umum adalah informasi hasil generalisasinya. Padahal dari sudut pengembangan bank data, hal ini sangat diperlukan. Mungkin masih dibutuhkan waktu sampai hal ini terlaksana.

Relevansi Data
Tidak semua data yang dipakai untuk pengolahan data geografis relevan dengan tujuan yang ingin dicapai, tetapi sering dipilih sebagai pengganti. Data yang diturunkan melalui pengindraan jauh dapat dipakai untuk menduga penggunaan lahan, biomassa, kelembaban atau pengamatan landform yang selanjutnya dipergunakan untuk menduga jenis tanah yang diikuti dengan pengamatan lapangan. Jika hubungan data penganti dengan variable yang diinginkan telah diketahui dengan baik maka pengganti ini juga menjadi sumber informasi yang baik.
Peta-peta yang diinginkan adakalanya dapat dikembangkan dari data lain dengan cara korelasi secara statistik yang lebih murah untuk mendeteksi sifat-sifat yang ada. Misalnya menggunakan analisis regresi, analisis co-spektral atau co-kriging. Dalam semua kasus data yang memakai cara pendugaan biasanya berkualitas lebih rendah dari data yang diinginkan. Pemakai harus waspada terhadap tampilan data yang indah. Bagaimanapun juga, adakalanya lebih efisien memakai data pengganti, karena biaya dan kesulitan mengukur sifat-sifat asli.

Format
Menurut Burrough (1986) ada 2 macam bentuk data yang penting dalam SIG, yang pertama, kemudahan data disajikan dalam media magnetic dan ditransfer ke suatu system computer ke sisitem lain.
Dalam hal ini termasuk berbagai pertimbangan seperti: media magnetik (disket, data-liune), kenampakan informasi ditulis panjang balok perekam, jumlah jalur (biasanya 9), kecepatan bit per inci (biasanya 800, 1600 atau 6250 BPI), tipe karakter (ASCII, Binary) dan panjang rekaman.
Pertimbangan kedua adalah cara data disusun atau struktur data tersebut apakah dinyatakan dengan kode titik-titk, vektor atau raster ? Jika daerah pengamatan tersebut dubuat dalam format raster, berapa ukuran selnya ? Apakah format data yang ada terikat ke system data tertentu dan dapat dikonversi ?. banyak sistem SIG sekarang, datanya dapat dikonversi dari suatu format ke format yang lain. Pemahaman format data yang tersedia akan memudahkan pemahaman kemungkinan hasil yamg dapat diperoleh.

Biaya
Pengumpulan dan pemasukan data baru membutuhkan konversi dan penyusunan kembali data lama sehinga membutuhkan dana. Pada setiap proyek, manajer proyek sebaiknya mampu menghitung biaya dan keuntungan menggunakan data yang sudah ada disbanding melaksanakan survey yang baru, biaya digitasi untuk pemasukan peta analog atau menghubungkan data atribut dengan data spasial. Scanner dapat mengganti pemasukan data dibandingkan digitasi seperti garis kontur dan citra fotografik. Adakalanya lebih murah mengontrakkan pekerjaan digital ke biro khusus untuk mengerjakannya sendiri, yang mana hasilnya lebih baik. Hal yang mirip, untuk instansi yang hanya sekali-kali perlu penampilan atau penghasilan data yang sangat baik, maka lebih murah menggunakan jas konsultan daripada harus membeli peralatan percetakan yang mahal.

Kesalahan yang Dihasilkan oleh Variasi Alam atau Variasi Pengukuran
Keakuratan Posisi
Keperluan keakuratan posisi data geografik sebagian besar tergantung pada tipe dasar. Data topografi biasanya disurvei dengan tingkat ketelitian posisis yang sangat tinggi, yang sesuai untuk obyek yang sudah sangat jelas seperti: jalan, rumah, batas tanah, dll. Dengan tehnik-tehnik modern seperti alat-alat elektronik, posisi proyek pada permukaan bumi dapat direkan hingga ketelitian desimeter. Kebalikannya, posisi batas-batas tanah atau vegetasi sering merefleksikan penelitian surveyor tentang garis batasnya, jika ada, sebaiknya digambarkan. Sangat sering, kesesuaian tipe-tipe vegetasi dari satu jenis kejenis lain terhadap tanah akan lebar sebagai hal yang bersifat transisi yang ditentukan oleh iklim mikro, relief tanah dan rejim kelembaban. Perubahan kelas lereng atau rejim air tanah juga sering berubah secara berangsur-angsur.
Kesalahan posisi ini dapat disebabkan oleh: pengukuran yang buruk dilapangan, melalui distorsi atau pengerutan kertas pada atau buruknya kualitas vektorisasi setelah proses penyiaman raster. Kesalahan local dapat diperbaiki langsung mengetahui digitasi sedangkan kesalahan umum dapat diperbaiki dengan berbagai transformasi, seperti, tehnik “rubber-sheetin” atau tehnik yang lain.
Keberhasilan tehnik transformasi ini tergantung tipe data yang ditransformasikan dan kekomplekan transformasi itu sendiri. Dari pengalaman, kebanyakan metode akan beranjak baik dengan transformasi linier sederhana.
Format ketiga yang perlu dipertimbangkan adalah data itu sendiri, skala, proyeksi, dan klasifikasi. Konversi skala dan proyeksi biasanya dapat dipenuhi dengan mudah dengan menggunakan transformasi matematika pada data koordinat. Sedangkan pencocokan klasifikasi lebih sulit dilakukan, hamper sama halnya dengan seseorang berusaha untuk mempelajari berbagai sistem klasifikasi.

Keakuratan Informasi (Isi)
Keakuratan informasi isi adalah persoalan yang menyangkut kebenaran titik, garis atau area dalam bank-data geografik. Dalam hal ini keakuratan dapat dibedakan menjadi akurasi yang bersifat kualitatif, seperti ukuran label atau data nominal dalam unit tertentu dimana tertulis “lapangan tennis”, dan akurasi yang bersifat kuantitatif, seperti kebenaran angka penulisan pH dalam suatu peta.
Keakuratan tipe ini sering terjadi karena salah pemasukan data baik dari atribut maupun geometri. Untuk menguji keakuratan ini maka perlu dilakukan pengambilan data contoh (sampel). Besarnya kesalahan dapat diketahui dengan membandingkan nilai pengamatan sampel dilapangan dengan yang dipetakan (lihat pengujian atribut, Tabel 8-2). Dalam kasus ilistrasi pada Gambar 8-5, pada peta 1 batas pengamatan sampel dan batas peta sama. Tetapi pada peta 2 dan 3, beberapa sampel titik tidak tepat posisinya. Kesalahan atribut dapat digambarkan dengan persentase titik yang keluar dari garis yang sebenarnya (diagonal).
Prosedur standar adalah sebagai dengan menghitung garis diagonal dengan menghiting Indeks Kappa Cohen
k=(d-q)/N-q),
dimana: d = jumlah titik dalam garis diagonal (garis standar),
N= jumlah total titik dan
q = jumlah titik harapan dalam setiap sel diagonal
(mencarinya dengan mengalikan total garis dan kolom tertentu dan selanjutnya dibagi dengan N).

Variasi Sumber Data
Variasi sumber data ini dapt dihubungkan dengan variasi pada waktu data dikumpulkan atau diukur, data lapangannya sendiri atau kesalahan laboratorium. Kesalahan pengukuran dapat dihasilkan oleh pengamatan yang salah. Apakah kesalahan alat pembaca yang kurat akurat, atau kesalahan yang lain sebaiknya pembaca memahami perbedaan akurasi dan presisi. Akurasi adalah tingkat bebesaran nilai perkiraan dibandingkan nilai sebenarnya, sebagai contoh, tingkat penyimpangan dari data.
Dalam pengertian statistik, presisi adalah suatu tingkat pengukuran disperse (biasanya diukur dengan simpangan baku) pengamatan dari nilai rata-rata posisi juga mengacu ke kemampuan komputer untuk menggambarkan jumlah dijit desimal suatu pengukuran. Kesalahan data lapangan sebenarnya berkaitan dengan kualitas surveyor. System pengambilan data yang tersusun dengan baik dan berstandar akan mengurangi kesalahan. Bagaimanapun juga konsep pengambilan data ini berkaitan dengan sistem yang dianut, yang dalam hal ini untuk kasus pemetaan tanah dan pemetaan geomorfologi hal ini jelas sekali pengaruhnya.
Sedangkan kesalahan yang dilaboratorium, secara mendasar, seseorang mengharapkan kualitas hasil penentuan laboratorium yang melebihi hasil pengamatan lapangan. Minimal juga prosedur yang sama dilakukan di laboratorium yang sama diharapakan dapat menghasilkan data yang bersifat reproduksibel.

Kesalahan yang Muncul Melalui Pengolahan
Kesalahan Numerik dalam Komputer
Kebanyakan kesalahan numerik dalam komputer tidak disadari oleh banyak orang, baik kesalahan variable dan jalur-jalur yang tidak mempunyai posisi, yang kesalahan perhitungan yang serius, khususnya bila hasil yang diperlukan yang harus diperoleh dengan pengurangan atau perkalian dua kelompok besar.
Pembuatan kesalahan-kesalahan tidak merupakan persoalan bila penampilan perhitungan statistik dalam komputer bila bahasa program memungkinkan variable berpresisi-dua dan jalur-jalurnya (array) didefinisikan. Pengaruh perhitungan ini dapat juga berkaitan dengan sistem numerik yang dipakai dalam perhitungan.
Sistem penulisan data angka dalam SIG/komputrapa keler yang umum terbagi beberapa kelompok yaitu bit, byte, integer, long-integer, dan real. Penulisan angka dalam bit berarti angka yang diawali adalah 1 dan 0, sedangkan byte mewakili angka 0-225, dan integer dari -32768 sampai +32767 (16 integer). Khusus untuk data integer maka skala perhitungan sangat penting diperhatikan, misalnya skala-1 yang berimplikasi terhadap kedetilan nilai integer (dengan kisaran yang lebih kecil), dan seterusnya. Perhitungan dalam integer yang ditulis dalam 4 dijit dapat juga dikelompokkan komanya.

Kesalahan yang Berkaitan dengan Analisis Topologi
Spasial persoalan yang muncul dalam pengolahan data spasial seperti tumpang-tindik dan berbagai algoritma lain yang diasumsikan seragam, relative banyak. Kebanyakan analisis dalam pengolahanruang secara implicit mengasimsikan bahwa (a) sumber data seragam, ( b) prosedur digitasi yang benar, (c) tumpang-tindih semata-mata persoalan interseksi garis atau batas, (d) batas dapat digambar tegas, (e) semua algoritma diasumsikan bekerja tepat, (f) kelas interval dibuat spesifik. Ide-ide ini diperoleh dari pendekatan tradisional dalam pemetaan dari klasifikasi obyek. Beberapa kesalah yang sering dikaitkan dengan analisis topologi ini adalah dalam kaitan dengan proses digitasi, tumpang-tindih dan konveksi bentuk data.
Kesalahan dalam proses digitasi umumnya penarikan garis yang keluar dari jalur yang harus diikutikesalahan yang bersumber dari pengolahan ini biasanya dihindari dengan menentukan kisaran ruang tertentu dalam suatu garis. Kisaran ini dibuat dengan mengikuti standar tertentu yang ditentukan sejak awal proses digitasi. Walaupun sudah ditentukan kisaran kesalahan tertentu yang diterima, tetapi sebenarnya terdapat variasi keakuratan data dan hasil, yang tidak diketahui dengan pasti. Kesalahan yang umum dijumpai dalam kaitan dengan proses digitasi peta atau pembuatan kode adalah berkaitan dengan kesalahan yang berasosiasi dengan sumber peta, dan kesalahan yang berasosiasi dengan penyajian dijital.
Kesalahan yang muncul karena proses tumpang-tindih sangat sering ditemui dalam analisis khususnya dalam SIG berbasis vector (dalam SIG raster juga dijumpai !). tanda yang mudah dilihat adalah muncul berbagai unit peta yang sangat kecil, yang jika proses analisis dalan SUG vector akan membuat proses sangat lama. Dalam SIG raster maka akan diperoleh unit peta yang bersifat mosaic (berbentuk unit-unit kecil dan sangat banyak) atau ditemukannya unit-unit tertentu di wilayah tertentu. Biasanya kesalahan ini dapat dieliminir dengan proses generalisasi (dalam SIG raster) atau dengan fungsi tertentu seperti spline (dalam SIG vector). Walaupun demikian kesalahan yang bersumber dari pengolahan ini juga sulit ditelusuri sumber kesalahannya atau memperbaikinya setelah diketahui kesalahannya.
Kesalahan lain yang juga sering muncul adalah kesalahan yang dihasilkan oleh pengkonversian data vektor ke raster tertentu atau sebaliknya. Untuk kesalahan konversi data vektor ke raster maka kesalahan ini dikontrol oleh ukuran sel raster yang diinginkan, atau ukuran dan kompensasi obyek-obyek yang terwakili dalam sel tertentu. Rumusan sederhana tenrtu sel raster akan mewakili obyek dominan dari obyek sebenarnya. Dalam hal ini bagaimanapun juga ada beberapa pendekatan yang dipakai untuk menerjemahkannya. Sedangkan untuk kesalahan untuk konversi data raster ke vektor maka kesalahan akan dikontrol selain oleh ukuran piksel, juga oleh metode penyambungan titik (piksel).