Memahami Statistik Ruang dan Geostatistik
Di mana statistik, statistik spasial , dan geostatistik cocok dalam
proyek GIS ? Dr Lauren Scott , seorang insinyur produk di tim geoprocessing
ESRI dan ahli dalam penggunaan statistik dalam konteks geospasial , jawaban
pertanyaan itu dan lain-lain dalam sebuah wawancara yang dilakukan oleh Matt
Artz , GIS ESRI dan manajer pemasaran ilmu pengetahuan dan editor GISandScience
. blog com .
Pada Esri , Scott bertanggung jawab untuk dukungan perangkat lunak ,
pendidikan, dokumentasi , dan pengembangan alat statistik spasial di ArcGIS .
Dia menerima gelar Ph.D. pada tahun 1999 dari Program Doktor Bersama di San
Diego State University dan University of California , Santa Barbara . Dia
memegang sarjana sastra dan B.A. dalam geografi dari California State
University , Fullerton .
Artz : Bagaimana statistik tradisional , statistik spasial , dan geostatistik
berbeda satu sama lain ?
Scott : statistik tradisional atau non - spasial biasanya digunakan dalam dua
cara yang berbeda . Dalam kasus pertama , kita memiliki satu set besar nilai
data yang ingin kita mengerti, dan kita dapat menggunakan statistik deskriptif
untuk mencoba untuk meringkas mereka. Dalam kasus kedua , kita mungkin memiliki
satu set sampel dan kita ingin tahu bagaimana orang- reflektif sampel dari
populasi yang lebih luas .
Artz : mana statistik spasial ikut bermain ?
Scott : statistik spasial dirancang khusus untuk digunakan dengan data spasial
dengan data geografis . Metode ini benar-benar menggunakan ruang- daerah ,
panjang , jarak , arah , orientasi , atau beberapa gagasan tentang bagaimana
fitur dalam dataset berinteraksi satu sama lain - tepat di matematika . Itu
benar-benar apa yang membuat statistik spasial berbeda dari metode statistik
tradisional.
Artz : Apakah ada berbagai jenis statistik spasial ?
Scott : Ya , ada banyak jenis yang berbeda . Ada statistik deskriptif spasial
mirip dengan statistik deskriptif tradisional. Sebagai contoh, jika kita
memiliki banyak titik-titik pada peta , kita mungkin ingin tahu di mana
titik-titik pusat berada. ( Setara statistik tradisional akan melibatkan
menghitung rata-rata untuk satu set nilai data . ) Kita mungkin juga ingin tahu
bagaimana menyebar titik-titik tersebut sekitar pusat. ( Hal ini mirip dengan
menghitung standar deviasi untuk satu set nilai . )
Metode statistik lainnya menggunakan analisis pola spasial : Kami mencoba untuk
mengidentifikasi apakah ada struktur data yang kita sedang melihat , misalnya ,
adalah fitur berkerumun ? Apakah mereka bubar ? Apakah nilai tinggi semua
ditemukan bersama-sama ? Apakah ada " hot spot " di data? Alat
analisis pola spasial dapat membantu kita untuk mengidentifikasi pola
pengeluaran anomali atau tidak biasa , tak terduga menemukan daerah dengan
tingkat tinggi penyakit , kejahatan , atau insiden kebakaran , atau trek difusi
beberapa kontaminan lingkungan . Ada benar-benar banyak aplikasi .
Lalu ada statistik spasial berkaitan dengan mengidentifikasi dan mengukur
hubungan spasial . Bayangkan kita melihat peta hot spot untuk 911 panggilan .
Kita mungkin ingin tahu tentang mengapa kita melihat begitu banyak panggilan ,
atau hot spot , di lokasi tertentu . Kita dapat menggunakan regresi dan
analisis regresi spasial untuk menguji hubungan dan untuk mengidentifikasi
faktor mempromosikan pola spasial kita mengamati - faktor yang akan membantu
kita menjelaskan mengapa 911 harga sangat tinggi.
Artz : Dan bagaimana Anda mendefinisikan geostatistik ?
Scott : Geostatistik adalah jenis statistik spasial . Kriging , misalnya,
adalah teknik geostatistik sangat kuat yang melampaui interpolasi , melihat
tidak hanya pada fitur terdekat untuk memprediksi nilai-nilai di mana Anda
tidak memiliki data sampel , tapi benar-benar memanfaatkan hubungan spasial untuk
memberikan kuat , prediksi yang lebih akurat .
Secara tradisional , geostatistik telah digunakan untuk menganalisis geologi
dan lingkungan data misalnya , curah hujan , atau elevasi - tujuan yang membuat
permukaan dari titik data sampel . Metode ini banyak digunakan dalam minyak dan
industri pertambangan . Tapi geostatistik yang ideal untuk menganalisis dan
memprediksi nilai-nilai yang berhubungan dengan hampir semua jenis spasial
fenomena berkelanjutan .
Artz : Bagaimana Esri ditujukan geostatistik dan statistik spasial dalam
penawaran produk ?
Scott : Banyak orang mungkin telah mendengar tentang ArcGIS Geostatistik
ekstensi Analyst , seperangkat khusus alat geostatistik . Hal ini berguna jika
Anda bekerja dengan data sampel yang diambil dari fenomena kontinu seperti
curah hujan, suhu , geologi , atau tanah dan tujuan Anda adalah untuk membuat
permukaan - permukaan probabilitas , permukaan prediksi , atau permukaan
kesalahan. Namun, karena produk tersebut telah ditingkatkan selama
bertahun-tahun , kemampuannya sekarang melampaui menciptakan permukaan dan
alat-alat yang berharga untuk berbagai macam aplikasi .
Semua pengguna ArcGIS juga mendapatkan Statistik Spasial Toolbox dengan alat
untuk menganalisis distribusi spasial , pola , proses , dan hubungan sebagai
bagian dari perangkat lunak inti di semua tingkatan lisensi. Alat-alat
statistik membiarkan Anda melakukan beberapa hal , termasuk menentukan tendensi
sentral atau mengidentifikasi tren arah menyeluruh , mengidentifikasi panas dan
dingin bintik-bintik atau outlier spasial , menilai pola keseluruhan
pengelompokan atau dispersi , dan pemodelan hubungan spasial . Saya sangat
senang dengan berapa banyak orang sekarang menggunakan alat ini ! Ketika saya
pertama kali mulai mengembangkan Statistik Spasial Toolbox sebagai satu set
script sampel , saya tidak benar-benar membayangkan seberapa sukses mereka akan
menjadi .
Artz : Apakah ada alat statistik lain yang pengguna dapat memanfaatkan dalam
ArcGIS ?
Scott : Tentu saja . Esri Business Analyst memiliki metode statistik untuk
mengidentifikasi pangsa pasar , area layanan , wilayah penjualan , dan
pelanggan potensial . Hal ini juga dilengkapi dengan banyak data untuk
digunakan dengan metode-metode . The ArcGIS ekstensi Spatial Analyst termasuk
metode statistik untuk membantu mengklasifikasikan penginderaan jauh data.so
alat statistik yang ditemukan di seluruh keluarga ArcGIS produk . Dan kerangka
geoprocessing di ArcGIS juga sangat diperpanjang , sehingga cukup mudah untuk
menghubungkan ke paket statistik tradisional. Anda juga dapat menciptakan alat
kustom Anda sendiri, alat-alat kustom bekerja sama seperti out-of -the-box alat
geoprocessing lainnya di ArcToolbox .
Bagi orang yang sudah menggunakan perangkat lunak SAS , baik SAS dan ESRI
menyediakan produk disebut Jembatan SAS yang membuatnya mudah untuk bekerja
baik dalam lingkungan perangkat lunak pada saat yang sama . Kami juga memiliki
beberapa contoh skrip yang tersedia untuk orang-orang untuk men-download dari
Pusat Sumber Daya Geoprocessing untuk menggunakan R , sumber paket statistik
terbuka , dalam kerangka ArcGIS .
Artz : Mengapa orang harus mempertimbangkan menggunakan statistik spasial ?
Scott : Ketika kita menganalisis data kami di luar spasial konteks ketika kita
menghapus ruang dan waktu dari data kami - rasanya kita hanya mendapatkan
setengah cerita . Hal-hal terjadi dalam ruang dan waktu , dan jika kita
mengabaikan itu, analisis kami akan menjadi tidak lengkap . Ini merupakan
perbedaan penting antara statistik tradisional dan statistik spasial :
statistik tradisional sering membuat asumsi bahwa data bebas dari sesuatu yang
disebut autokorelasi spasial .
Artz : Apa autokorelasi spasial ?
Scott : Ini adalah kata yang besar , tetapi itu adalah konsep yang sangat
sederhana : autokorelasi spasial hanya berarti bahwa ada struktur spasial dalam
data Anda . Struktur yang mungkin clustering, atau beberapa jenis dispersi ,
tetapi dalam hal apapun , distribusi fitur Anda , atau nilai-nilai data yang
terkait dengan fitur Anda , tidak acak . Jobs, rumah , manufaktur ,
opportunities.these belanja tidak acak ditaburi seluruh lanskap , mereka
berkumpul bersama-sama ke kota dan kabupaten dan zona penggunaan lahan . Data
Spasial autocorrelated melanggar asumsi untuk beberapa metode statistik
tradisional dan sehingga sering dianggap sebagai gangguan oleh para ahli
statistik tradisional.
Analis GIS dan statistik spasial , bagaimanapun , merasa senang ketika mereka
melihat autokorelasi spasial dalam data mereka , ketika mereka mengamati
pengelompokan dalam lanskap - karena itu bukti bahwa yang mendasari proses
spasial sedang bekerja . Dan itu menarik ! Sesuatu di luar sana yang
menyebabkan pengelompokan ini atau struktur , adalah mempromosikan berbagai
jenis hubungan dan pola spasial , sering pemahaman bahwa " sesuatu "
adalah apa yang kita paling tertarik masuk Mengapa orang terus-menerus mati di
usia muda di bagian negara ? Apa yang mungkin menjadi faktor menjelaskan
mengapa anak-anak di distrik sekolah ini secara konsisten menyerahkan nilai
ujian yang tinggi ?
Proses spasial sering terlihat , tetapi dengan menggunakan alat-alat dalam
Statistik Spasial Toolbox untuk mengukur kekuatan dan skala mereka hasil -
spasial pengelompokan atau dispersi , hot spot , atau spasial outlier - kita
belajar lebih banyak tentang mereka dan kami mendapatkan pemahaman yang lebih
baik data kami .
Artz : Anda berbicara dengan banyak orang tentang GIS statistik . Apa yang
menurut Anda paling sering disalahpahami tentang statistik spasial ?
Scott : Dalam komunitas GIS , hal itu mungkin yang paling sering disalahpahami
hanya yang sulit ! Orang mendengar " statistik " dan mereka segera
memiliki kenangan buruk dari kelas mereka mengambil di sekolah tinggi , dan
mereka hanya ditutup . Dan saya pikir itu terlalu buruk , karena bagi saya , sementara
statistik tradisional yang menarik , statistik spasial benar-benar menarik !
Dan mereka tidak begitu sulit . Beberapa statistik spasial mencerminkan
konsep-konsep yang sangat sederhana , namun tetap saja mereka dapat digunakan
dalam cara yang sangat kuat.
Artz : Bisakah Anda memberi saya contoh alat statistik yang sederhana , namun
kuat ?
Scott : Alat sederhana dalam Statistik Spasial Toolbox adalah alat pusat
berarti . Ia bekerja dengan mengambil semua x- koordinat , dan menghitung
rata-rata . Ia kemudian mengambil semua Anda y - koordinat , dan menghitung
rata-rata bagi mereka . Rata-rata pusat adalah bahwa x dan y koordinat
rata-rata lokasi . Berapa banyak lebih sederhana yang bisa kita dapatkan dari
itu ? Tapi Anda dapat menggunakan alat ini dengan cara yang kuat . Sebagai
contoh, kita melihat data penduduk oleh daerah untuk California selama 100
tahun terakhir . Kami tertarik untuk mencari pusat populasi dan melihat jika
itu berubah dari waktu ke waktu , jadi kami dihitung rata-rata tertimbang pusat
. Pada bagian awal abad ini , pusat populasi berada di dekat San Francisco ,
sebuah refleksi dari industri perbankan tumbuh di sana . Setiap dekade pusat
penduduk pindah ke selatan , pada awalnya sangat cepat , mencerminkan
pertumbuhan di California selatan yang terkait dengan industri minyak , di
Hollywood , kedirgantaraan, dan segala sesuatu yang lain terjadi di sana . The
selatan pergeseran pusat populasi melambat , namun, menjelang akhir abad ini .
Alat sederhana dalam Tata Ruang Statistik Toolbox memungkinkan kita untuk
memvisualisasikan tren kompleks spasial, seberapa cepat rata-rata pusat
bergerak , dan di mana ia bergerak , memberikan informasi menarik tentang
proses spasial mempromosikan pergeseran selatan dalam populasi .
Artz : Tapi beberapa alat yang tidak sesederhana pusat rata-rata ?
Scott : Benar . Kebanyakan alat GIS cukup mudah, Anda hanya mengisi parameter
dan pergi . Untuk beberapa alat statistik spasial , namun, Anda harus berpikir
sedikit lebih banyak tentang hubungan spasial , skala analisis Anda , batas
wilayah studi , dan sebagainya. Tapi kami berusaha sangat keras untuk
memasukkan strategi yang baik dalam dokumentasi ArcGIS yang menjelaskan
penggunaan yang tepat dari alat dan membantu Anda memutuskan parameter yang
tepat untuk analisis tertentu .
Artz : Dimana orang dapat mempelajari lebih lanjut tentang menggunakan
statistik dalam proyek-proyek GIS mereka ?
Scott : Dalam buku The ESRI Panduan untuk Analisis GIS , Volume 2 , oleh Andy
Mitchell , setiap bab sesuai dengan alat dalam Statistik Spasial Toolbox . Ini
adalah sumber daya yang besar bagi orang-orang yang mulai dengan sedikit atau
tanpa pengetahuan statistik spasial . Kami juga memiliki beberapa webinar
gratis dan tutorial tersedia melalui Virtual Kampus ESRI dan ArcGIS
Geoprocessing Resource Center . GISandScience.com blog Anda berisi cukup
sedikit sumber daya untuk belajar tentang statistik spasial dan analisis
spasial dalam arti yang lebih umum.
Sumber
: http://www.esri.com/news/arcwatch/0410/lauren-scott.html