Skip to main content

'ข้อมูลขนาดใหญ่' คืออะไร?

พัฒนาการเกษตรไทยสู่ระบบอัจฉริยะด้วยการใช้ข้อมูลขนาดใหญ่ (มิถุนายน 2026)

พัฒนาการเกษตรไทยสู่ระบบอัจฉริยะด้วยการใช้ข้อมูลขนาดใหญ่ (มิถุนายน 2026)

:

Anonim

'ข้อมูลขนาดใหญ่' เป็นวิทยาศาสตร์ใหม่ในการทำความเข้าใจและคาดการณ์พฤติกรรมของมนุษย์ด้วยการศึกษาปริมาณข้อมูลที่ไม่มีโครงสร้าง ข้อมูลขนาดใหญ่เรียกว่า 'analytical predictive analytics'

การวิเคราะห์โพสต์ Twitter, ฟีด Facebook, การค้นหา eBay, เครื่องติดตาม GPS และเครื่อง ATM เป็นตัวอย่างข้อมูลขนาดใหญ่ การศึกษาข้อมูลการรักษาความปลอดภัยข้อมูลการจราจรรูปแบบสภาพอากาศการเข้ามาเที่ยวบินหอนาฬิกาโทรศัพท์มือถือและเครื่องติดตามอัตราการเต้นของหัวใจเป็นรูปแบบอื่น ๆ ข้อมูลขนาดใหญ่เป็นวิทยาศาสตร์ใหม่ ๆ ที่ยุ่งเหยิงซึ่งมีการเปลี่ยนแปลงทุกสัปดาห์และมีเพียงไม่กี่ผู้เชี่ยวชาญที่เข้าใจเรื่องทั้งหมด

อะไรคือตัวอย่างบางส่วนของข้อมูลขนาดใหญ่ในชีวิตปกติ?

แม้ว่าโครงการข้อมูลขนาดใหญ่ส่วนใหญ่จะคลุมเครือ แต่ก็มีตัวอย่างที่ประสบความสำเร็จจากข้อมูลขนาดใหญ่ที่ส่งผลต่อชีวิตประจำวันของบุคคล บริษัท และรัฐบาลต่างๆดังนี้

การคาดการณ์การระบาดของไวรัส: โดยการศึกษาข้อมูลทางสังคมการเมืองข้อมูลสภาพอากาศและสภาพภูมิอากาศและข้อมูลโรงพยาบาล / ข้อมูลทางวิทยาศาสตร์นักวิทยาศาสตร์เหล่านี้กำลังคาดการณ์การระบาดของโรคไข้เลือดออกโดยแจ้งล่วงหน้า 4 สัปดาห์

นาฬิกาฆาตกรรม: โครงการโปรไฟล์ข้อมูลขนาดใหญ่นี้เป็นรูปเหยียดผู้ตกเป็นเหยื่อการฆาตกรรมผู้ต้องสงสัยและอาชญากรในวอชิงตันดีซี ทั้งสองเป็นวิธีการเพื่อเป็นเกียรติกับผู้ตายและเป็นทรัพยากรที่มีการรับรู้สำหรับผู้คนโครงการข้อมูลขนาดใหญ่แห่งนี้น่าสนใจ

การวางแผนการเดินทางข้ามประเทศ NYC: โปรแกรมเมอร์วิทยุ WNYC Steve Melendez ได้รวมตารางการเดินรถไฟใต้ดินออนไลน์ไว้กับซอฟต์แวร์การเดินทางท่องเที่ยว การสร้างของพระองค์ช่วยให้ชาวนิวยอร์กคลิกตำแหน่งของพวกเขาบนแผนที่และการคาดการณ์เวลาเดินทางสำหรับรถไฟและรถไฟใต้ดินจะปรากฏขึ้น

ซีร็อกซ์ลดการสูญเสียแรงงานของพวกเขา: งานศูนย์บริการทางโทรศัพท์เป็นเรื่องที่เหนื่อยล้าทางอารมณ์ Xerox ได้ศึกษาการรีบข้อมูลด้วยความช่วยเหลือของนักวิเคราะห์มืออาชีพและตอนนี้พวกเขาสามารถคาดเดาได้ว่าศูนย์บริการใดที่ได้รับการว่าจ้างมีแนวโน้มที่จะอยู่กับ บริษัท นี้เป็นเวลานานที่สุด

การสนับสนุนการต่อต้านการก่อการร้าย: โดยการศึกษาสื่อสังคมบันทึกทางการเงินจองเที่ยวบินและข้อมูลความปลอดภัยการบังคับใช้กฎหมายสามารถทำนายและหาผู้ต้องสงสัยว่าเป็นผู้ก่อการร้ายก่อนที่พวกเขาจะกระทำการชั่วของตน

การปรับการตลาดแบรนด์ตามความเห็นของโซเชียลมีเดีย: คนอย่างโผงผงและแชร์ความคิดออนไลน์ของพวกเขาในผับร้านอาหารหรือคลับออกกำลังกาย เป็นไปได้ในการศึกษาบทความสื่อสังคมออนไลน์จำนวนหลายล้านฉบับเหล่านี้และให้ข้อเสนอแนะแก่ บริษัท เกี่ยวกับสิ่งที่ผู้คนคิดถึงบริการของตน

ใครใช้ข้อมูลขนาดใหญ่? พวกเขาทำอะไรกับมัน?

บริษัท เสาหินหลายแห่งใช้ข้อมูลขนาดใหญ่เพื่อปรับราคาเสนอและราคาเพื่อเพิ่มความพึงพอใจสูงสุด

  • ห้างสรรพสินค้าของ Macyตัวอย่างเช่นใช้ข้อมูลขนาดใหญ่เพื่อปรับราคาให้ได้ทันทีสำหรับผลิตภัณฑ์กว่า 70 ล้านรายการ พวกเขายังส่งอีเมลที่กำหนดเองให้กับลูกค้าตามสิ่งที่ Macy เชื่อว่าพวกเขาสนใจ
  • การตอบสนองของตำรวจต่อการทิ้งระเบิดในบอสตันมาราธอน: โดยการใช้ข้อมูลขนาดใหญ่เพื่อการศึกษาภาพวิดีโอและภาพการเฝ้าระวังตำรวจได้อย่างรวดเร็วสามารถ จำกัด การค้นหาผู้ต้องสงสัยได้
  • สเต๊กเฮาส์ Morton's ใช้ Twitter เพื่อดึงการละเล่นการตลาดรวมถึงการจัดส่งสนามบินนิวเจอร์ซีย์ที่มีชื่อเสียงของห้องอาหารสเต็กและอาหารมื้อค่ำของ Porterhouse
  • วีซ่าใช้ข้อมูลขนาดใหญ่เพื่อระบุและจับคนร้ายการทำธุรกรรมเดี่ยวที่นี่และที่นี่สามารถปิดบังผู้ใช้บัตรเครดิตที่ไม่สุจริต แต่โดยการเฝ้าดูการทำธุรกรรมนับล้านอย่างระมัดระวังรูปแบบการฉ้อโกงสามารถตรวจพบได้
  • Facebook ใช้ข้อมูลขนาดใหญ่เพื่อปรับแต่งโฆษณา. การศึกษาพฤติกรรมการชอบและการเรียกดูข้อมูลแบบ FB ของคุณทำให้สื่อสังคมออนไลน์มีความเข้าใจลึกซึ้งในรสนิยมของคุณ โฆษณาด้านข้างเหล่านี้ที่คุณเห็นในฟีด Facebook ของคุณจะถูกเลือกโดยอัลกอริทึมที่ละเอียดรอบคอบและซับซ้อนที่ได้รับการเฝ้าดูพฤติกรรมใน Facebook ของคุณ

ทำไมข้อมูลขนาดใหญ่จึงเป็นเรื่องใหญ่?

4 สิ่งที่ทำให้ข้อมูลสำคัญมาก:

1. ข้อมูลมีขนาดใหญ่ มันจะไม่พอดีกับฮาร์ดดิสก์ตัวเดียวและใช้ USB stick น้อยลง ปริมาณข้อมูลที่ไกลเกินกว่าสิ่งที่จิตใจของมนุษย์สามารถรับรู้ได้ (คิดเป็นพันล้านล้านเมกะไบต์และคูณด้วยพันล้าน)

2. ข้อมูลไม่เป็นระเบียบและไม่มีโครงสร้าง 50% ถึง 80% ของงานข้อมูลขนาดใหญ่คือการแปลงและทำความสะอาดข้อมูลเพื่อให้สามารถค้นหาและจัดเรียงได้ ผู้เชี่ยวชาญเพียงไม่กี่พันคนบนโลกของเราเท่านั้นที่ทราบวิธีการล้างข้อมูลนี้ ผู้เชี่ยวชาญเหล่านี้ยังต้องการเครื่องมือพิเศษอย่าง HPE และ Hadoop เพื่อทำหัตถกรรม บางทีในรอบ 10 ปีผู้เชี่ยวชาญด้านข้อมูลขนาดใหญ่จะกลายเป็นค่าทิปโหล แต่ตอนนี้พวกเขาเป็นนักวิเคราะห์ที่หายากมากและงานของพวกเขาก็ยังไม่ชัดเจนและน่าเบื่อ

3. ข้อมูลกลายเป็นสินค้า ** ที่สามารถขายได้ ตลาดข้อมูลมีที่ซึ่ง บริษัท และบุคคลทั่วไปสามารถซื้อเทราไบต์ของโซเชียลมีเดียและข้อมูลอื่น ๆ ได้ ข้อมูลส่วนใหญ่เป็นระบบคลาวด์เนื่องจากมีขนาดใหญ่เกินไปเพื่อให้พอดีกับฮาร์ดดิสก์ตัวใดตัวหนึ่ง ข้อมูลการซื้อมักเกี่ยวข้องกับค่าสมัครที่คุณต่อเข้ากับเซิร์ฟเวอร์ฟาร์มระบบคลาวด์

** ผู้นำของเครื่องมือข้อมูลขนาดใหญ่และไอเดียต่างๆ ได้แก่ Amazon, Google, Facebook และ Yahoo เนื่องจาก บริษัท เหล่านี้ให้บริการผู้คนนับล้านกับบริการออนไลน์ของตนทำให้รู้สึกว่าพวกเขาเป็นจุดรวบรวมและมีวิสัยทัศน์ที่อยู่เบื้องหลังการวิเคราะห์ข้อมูลขนาดใหญ่

4. ความเป็นไปได้ของข้อมูลขนาดใหญ่ไม่มีที่สิ้นสุด บางทีหมอจะมีวันทำนายการโจมตีหัวใจและจังหวะสำหรับสัปดาห์ก่อนที่จะเกิดขึ้น การชนกันของเครื่องบินและรถยนต์อาจลดลงด้วยการวิเคราะห์ข้อมูลทางกลและรูปแบบการจราจรและสภาพอากาศของพวกเขา การหาคู่ออนไลน์อาจได้รับการปรับปรุงให้ดีขึ้นโดยมีตัวบ่งชี้ข้อมูลขนาดใหญ่สำหรับผู้ที่มีบุคลิกที่เข้ากันได้สำหรับคุณ นักดนตรีอาจได้รับข้อมูลเชิงลึกเกี่ยวกับองค์ประกอบเพลงที่ชื่นชอบที่สุดในรสนิยมที่เปลี่ยนแปลงไปของกลุ่มเป้าหมายนักโภชนาการอาจคาดการณ์ได้ว่าการรวมกันของอาหารที่ซื้อในร้านใดจะทำให้ผู้ป่วยหนักหน่วงหรือช่วยรักษาอาการเจ็บป่วยได้ พื้นผิวมีรอยขีดข่วนและการค้นพบข้อมูลขนาดใหญ่เกิดขึ้นทุกสัปดาห์

ข้อมูลขนาดใหญ่ไม่เป็นระเบียบ

ข้อมูลขนาดใหญ่คือการวิเคราะห์เชิงคาดการณ์: การแปลงข้อมูลที่ไม่มีโครงสร้างเป็นข้อมูลที่สามารถค้นหาและจัดเรียงได้ นี่เป็นพื้นที่ยุ่งเหยิงและยุ่งเหยิงที่ต้องใช้ความรู้และความอดทนเป็นพิเศษ

ยกตัวอย่างเช่นบริการจัดส่ง UPS แบบเสาเข็ม โปรแกรมเมอร์ที่ UPS ศึกษาข้อมูลจาก GPS ไดรเวอร์และสมาร์ทโฟนเพื่อวิเคราะห์วิธีที่มีประสิทธิภาพมากที่สุดเพื่อปรับให้เข้ากับความแออัดของการจราจร ข้อมูล GPS และสมาร์ทโฟนนี้มีขนาดใหญ่และไม่พร้อมสำหรับการวิเคราะห์โดยอัตโนมัติ ข้อมูลนี้จะมาจาก GPS และฐานข้อมูลแผนที่ต่างๆผ่านอุปกรณ์ฮาร์ดแวร์ต่างๆของสมาร์ทโฟน นักวิเคราะห์ของ UPS ใช้เวลาหลายเดือนในการแปลงข้อมูลทั้งหมดลงในรูปแบบที่สามารถค้นหาและจัดเรียงได้ง่าย ความพยายามนี้คุ้มค่า วันนี้ยูพีเอสช่วยประหยัดเชื้อเพลิงได้มากกว่า 8 ล้านแกลลอนเนื่องจากเริ่มมีการใช้ข้อมูลขนาดใหญ่เหล่านี้

เนื่องจากข้อมูลขนาดใหญ่ยุ่งมากและต้องใช้ความพยายามอย่างมากในการทำความสะอาดและเตรียมตัวสำหรับการใช้ข้อมูลนักวิทยาศาสตร์ข้อมูลจึงกลายเป็นชื่อเล่นว่า 'ภารโรงข้อมูล' สำหรับงานที่น่าเบื่อทั้งหมดที่พวกเขาทำ

วิทยาศาสตร์ของข้อมูลขนาดใหญ่และการวิเคราะห์เชิงคาดการณ์มีการปรับปรุงทุกสัปดาห์แม้ว่า คาดว่าข้อมูลขนาดใหญ่จะสามารถเข้าถึงได้ง่ายสำหรับทุกคนภายในปี พ.ศ. 2568

ข้อมูลขนาดใหญ่ไม่เป็นภัยคุกคามต่อข้อมูลส่วนบุคคลหรือไม่?

ใช่ถ้ากฎหมายและการป้องกันข้อมูลส่วนบุคคลของเราไม่มีการจัดการอย่างรอบคอบข้อมูลขนาดใหญ่จะแทรกแซงความเป็นส่วนตัว เมื่อพูดถึง Google และ YouTube และ Facebook ได้ติดตามพฤติกรรมออนไลน์ของคุณทุกวันแล้ว สมาร์ทโฟนและคอมพิวเตอร์ของคุณทิ้งรอยดิจิตอลทุกวันและ บริษัท ที่มีความซับซ้อนกำลังศึกษารอยเท้าเหล่านี้

กฎหมายที่เกี่ยวกับข้อมูลขนาดใหญ่กำลังพัฒนาขึ้น ความเป็นส่วนตัวคือสถานะของการเป็นที่ตอนนี้คุณต้องรับผิดชอบส่วนบุคคลเนื่องจากคุณไม่สามารถคาดหวังว่าจะเป็นสิทธิ์ดีฟอลต์ได้

สิ่งที่คุณสามารถทำได้เพื่อปกป้องข้อมูลส่วนบุคคลของคุณ:

ขั้นตอนเดียวที่ใหญ่ที่สุดที่คุณสามารถทำได้คือการปกปิดนิสัยประจำวันของคุณโดยใช้การเชื่อมต่อเครือข่าย VPN บริการ VPN จะแย่งสัญญาณของคุณเพื่อให้ข้อมูลประจำตัวและตำแหน่งของคุณถูกสวมหน้ากากอย่างน้อยบางส่วนจากแทร็กเกอร์ การทำเช่นนี้จะไม่ทำให้คุณเป็นแบบไม่ระบุชื่อ 100% แต่ VPN จะช่วยลดจำนวนผู้คนทั่วโลกที่สามารถสังเกตพฤติกรรมออนไลน์ของคุณได้

ฉันสามารถเรียนรู้เพิ่มเติมเกี่ยวกับข้อมูลขนาดใหญ่ได้ที่ไหน?

ข้อมูลขนาดใหญ่เป็นสิ่งที่น่าสนใจสำหรับผู้ที่มีจิตใจในการวิเคราะห์และรักเทคโนโลยี ถ้าเป็นเช่นนั้นคุณก็เยี่ยมชมหน้าโครงการข้อมูลขนาดใหญ่ที่น่าสนใจนี้