Penyeksaan Air - Analogi Analisis Berjauhan

analisis titisan

Data, seperti air, terdapat dalam pelbagai bentuk. Pikiran manusia telah berkembang untuk menyaring sebahagian besar data yang datang kerana kita mempunyai begitu banyak data.

Apabila anda membuka mata dan telinga anda, data ada di mana-mana. Warna dinding, suara penyaman udara dan bau kopi jiran anda diperlakukan seperti kelembapan. Air di udara sepanjang masa tetapi tidak berguna untuk memperhatikannya.

Apabila air menjadi kabut, ia memaksa anda untuk melihatnya dan menjadikan pemahaman tentang dunia di sekitar anda menjadi lebih sukar. Set data yang tidak lengkap, data yang rosak, sains yang buruk, kesimpulan yang salah dan bias kognitif semuanya membuat anda tersesat dalam kabut.

Data jatuh seperti hujan. Apabila ada sedikit, sangat tidak memuaskan - cukup untuk membuat kereta anda kotor dan membingungkan perbualan. Anda mendapati diri anda menghilangkan titik pada cermin mata anda ketika seseorang menyemburkan titik data rawak, yang dikumpulkan dari beberapa sumber yang tidak jelas.

  • Air basi di kolam cetek berbahaya. Data, yang dikumpulkan dari bekalan yang tidak boleh dipercayai, tidak dibersihkan atau dinormalisasi dan dibiarkan tumbuh tidak bergerak, boleh menyebabkan kesimpulan yang salah.
  • A tetak stabil air cukup untuk memenuhi kantin atau mengekalkan ekosistem hutan. Hanya tiga titik data (jumlah e-mel yang dihantar, berbanding yang dibuka, berbanding yang diklik) dapat mengekalkan program pemasaran.
  • A aliran lebih sihat data dalam bentuk anak sungai kecil boleh digunakan untuk mandi. Aliran data yang berterusan membolehkan penanda aras dan perbandingan bersejarah. Pengoptimuman halaman pendaratan dapat dicapai dengan data penukaran yang stabil.
    A sungai sederhana boleh menggerakkan kilang untuk menggergaji kayu atau mengisar gandum. Mesin cadangan hanya memerlukan sumbangan yang boleh dipercayai dari segelintir anak sungai untuk memberikan peningkatan nilai keranjang belanja.
  • A air terjun dapat mendorong kincir air yang besar dan kemasukan maklumat yang mencukupi dapat mendorong sistem kandungan dinamik secara real time.
  • A sungai yang luas dan cukup mendalam dapat menyokong keseluruhan industri pengangkutan. Data yang mencukupi dapat mengapung tongkang dan kapal kargo dalam bentuk kumpulan kuki dari rangkaian iklan, agregator data program kad kesetiaan, dan broker data.

Apabila data tiba dalam jumlah yang diharapkan pada waktu yang dijangkakan, data dapat ditangkap, disalurkan dan digunakan. Sistem pengairan, empangan dan takungan memberikan perasaan terkawal dan memungkinkan untuk membina infrastruktur yang semakin luas dengan terusan, kunci dan empangan. Gudang data telah dibina berdasarkan aliran yang kurang dipercayai.

Kebersihan Bersebelahan dengan Ketuhanan

Air bersih sangat penting untuk kejayaan hidup, pengairan, loji pembangkit tenaga elektrik, dll. Definisi 'bersih' mungkin berubah untuk tujuan tersebut; tidak mengapa jika terdapat alga di dalam air yang menyejukkan loji janakuasa dan tidak boleh diterima jika terdapat lebih daripada 10 bahagian per bilion arsenik dalam air minuman.

Data adalah sama. Dalam aplikasi surat terus, sama ada anda mempunyai gelaran seseorang (Mr, Mrs., Ms.) tidak penting ... melainkan anda menghantar surat kepada doktor. Tetapi data kotor akan membuat anda kecewa setiap masa.

Sebagai Ketua Saintis Data AS, DJ Patil, letakkan di Sidang Kemuncak CTO Pusingan Pertama, “Sekiranya anda tidak memikirkan bagaimana menjaga kebersihan data anda sejak awal, anda sudah f ^ ¢ & ed. Saya jamin. Mencuba untuk membersihkannya setelah fakta memerlukan sekurang-kurangnya beberapa bulan. "

Sekiranya anda memanaskan air ke takat didih, ia akan menggerakkan seluruh Revolusi Industri. Data nampaknya melakukan perkara yang sama. Dari saat komputer dapat menyimpan dan juga menghitung, data telah dikumpulkan secepat peralatan penyimpanan dapat dibuat untuk melakukannya.

Tasik Data

Oleh kerana data dari anak sungai ini menembus mesin penggiling, semuanya berakhir di tasik, di belakang empangan. Oleh kerana data dikeluarkan secara terkawal, ia menggerakkan turbin industri data; mesin pemprosesan data yang besar dengan nama seperti Google dan Facebook. Tidak akan berlaku kemarau di sini.

Dan, akhirnya, ada kolam air yang dalam, menunggu penganalisis menyelam. Gigi skuba dan pistol tombak di tangan, penganalisis menyelidiki kedalaman, memetakan tanah baru dan menemui spesies baru. Ini adalah masa yang sangat menggembirakan untuk menjadi penjelajah data.

Itulah sebabnya begitu banyak dari mereka telah muncul untuk Sidang Kemuncak eMetrik sejak tahun 2002. Peluang seterusnya adalah di Boston, 27 September hingga 1 Oktober 2015.

Pendaftaran Kemuncak eMetrik

A Bridge Too Far

Dan bagaimana kekuatan data untuk mengukir Grand Canyon seterusnya? Bagaimana dengan pencairan glasial data berstruktur? Bagaimana kita memperlakukan air buangan di dunia yang semakin menyedari privasi?

Itu adalah persoalan untuk waktu yang lain dan air di bawah jambatan.

Apa yang anda fikir?

Laman web ini menggunakan Akismet untuk mengurangkan spam. Ketahui bagaimana data komen anda diproses.