Big Data Definition/ นิยามของ Big Data

Big Data เป็นคำที่ได้ยินบ่อยในระยะหลัง ซึ่งค่อนข้างจะสร้างความงุนงงให้กับผู้ฟังที่ไม่ได้อยู่ในแวดวงไอทีว่ามันคืออะไร แล้วมันแตกต่างจากคำว่า Data ธรรมดาอย่างไรบ้าง ในบทความนี้จะมาคุยถึงนิยามของ Big Data ในแง่มุมต่างๆ เพื่อให้ผู้อ่านเข้าใจในคำๆนี้มากขึ้น

หากผู้อ่านต้องการความหมายของ Big Data ที่เหมือนการหาความหมายในพจนานุกรมหรือดิกชันนารี คงต้องเหนื่อยและสับสนไม่ใช่น้อย เพราะดิกชันนารีแต่ละเจ้าเขียนไม่เหมือนกันเลย

ผู้เขียนได้อ่านเจอบทความหนึ่งจากต่างประเทศที่ได้รวบรวมความหมายของ Big Data จาก 40 บุคคลชั้นนำด้านไอทีและผู้นำองค์กร รวมไปถึงบทความทีรวบรวมความหมายจากหลายเว็บไซด์ แต่ละแหล่งก็ได้ให้ความหมายของ Big Data ที่แตกต่างกันไป เหตุที่เป็นเช่นนี้เพราะไม่มีองค์กรใดที่ได้รับการยอมรับหรือมีอำนาจมากพอที่จะชี้ชัดความหมายของคำให้กลายเป็นมาตรฐาน

ยกตัวอย่างคำในภาษาไทย เมื่อยกคำหนึ่งคำเพื่อหาความหมายตามเว็บหรือพจนานุกรม ส่วนใหญ่จะมีความหมายเหมือนกันหรือใกล้เคียงกันเพราะเว็บหรือพจนานุกรมเหล่านั้นล้วนเอาความหมายจากพจนานุกรมจากราชบัณฑิตยสถาน ซึ่งถือว่าเป็นองค์กรที่รัฐบาลให้การยอมรับในการกำหนดความหมายของคำในภาษาไทย แต่คำว่า Big Data และอีกหลายๆคำในวงการไอที เช่น Cloud ต่างก็ประสบปัญหาเรื่องนิยามและความหมาย เพราะไม่มีองค์กรที่คล้ายราชบัณฑิตยสถานมาค่อยกำกับ ผลก็คือความหมายจะแปรเปลี่ยนไปตามประสบการณ์ของผู้แปล

ถึงแม้ว่าจะไม่มีความหมายที่ตายตัวและแน่ชัด การรับฟังความหมายของ Big Data ที่แต่ละคนตีความก็ยังเป็นสิ่งที่น่าสนใจ ผู้เขียนได้นำเอาความหมายของ Big Data จากหลายๆแหล่ง มาจัดแบ่งกลุ่ม เพื่อให้เห็นนัยยะกว้างๆ ถึงสิ่งที่ผู้ให้นิยามคิดคำนึงเมื่อพูดถึง Big Data

นิยาม Big Data ในแง่ของปัญหา หรือ ความท้าทายในการจัดการข้อมูล

Wikipedia และ New York Time ต่างยกเครดิตให้ John Mashey เป็นผู้ให้นิยามและเริ่มใช้คำว่า Big Data กับงานสัมมนากลุ่มที่ตัวเองเป็นวิทยากรตั้งแต่ 1990 น่าเสียดายที่ไม่มีหลักฐานการใช้คำนี้ในงานเอกสารวิชาการ หลักฐานทางวิชาการที่มีการใช้คำว่า Big Data ครั้งแรกอยู่ในหัวข้อเรื่อง “Application-controlled demand paging for out-of-core visualization “ ซึ่งถูกเขียนขึ้นในปี 1997

ไม่ว่าใครเป็นคนแรกที่ใช้คำว่า Big Data ทั้งสองต่างพูดถึงสิ่งเดียวกันคือ “ปัญหา” จากข้อมูลที่มากเสียจนฮาร์ดแวร์และซอฟท์แวร์ในเวลานั้นไม่สามารถรองรับได้ และกลายเป็น “ความท้าทาย” ที่นักวิจัยสาขาไอทีต้องขบคิดเพื่อแก้ปัญหานั้น

ปัจจุบันฮาร์ดแวร์มีราคาถูกและมีซอฟท์แวร์มากมายที่ถูกใช้เป็นเครื่องมือสำหรับจัดการข้อมูลขนาดยักษ์ แต่คำว่า Big Data สำหรับนักวิจัยด้านไอทีและนักวิทยาศาสตร์ข้อมูล มันยังคงเป็นปัญหาที่ไม่มีวันจบและยังคงต้องพัฒนาต่อไปเรื่อยๆ เพราะข้อมูลนับวันจะมีแต่ใหญ่ขึ้น เร็วขึ้น  ซับซ้อนขึ้น ความต้องการเครื่องมือใหม่ในการจัดการเพื่อตามข้อมูลให้ทัน ก็มีมากด้วยเช่นเดียวกัน

ข้างล่างเป็นตัวอย่างผู้ให้คำนิยามของ Big Data ในแง่ของปัญหาหรือความท้าทายในการจัดการข้อมูล

“ข้อมูลขนาดใหญ่มากจนถึงจุดที่การใช้งานและการจัดการแสดงให้เห็นถึงปัญหาอย่างเด่นชัด”
“data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges.” Oxford English Dictionary (OED), Lastest View: 20180511

“ชุดข้อมูลที่มีปริมาณและความซับซ้อนสูงจนซอฟท์แวร์เกี่ยวกับการประมวลผลข้อมูลแบบดั้งเดิมไม่มีประสิทธิภาพเพียงพอที่จะจัดการ”
“datasets that are so voluminous and complex that traditional data-processing application software are inadequate to deal with them” Wikipedia, Lastest View: 20180511

“ชุดข้อมูลที่ขนาดของมันอยู่เหนือความสามารถที่ซอฟท์แวร์จัดการฐานข้อมูลแบบดั้งเดิมจะ จับ เก็บ จัดการ และ วิเคราะห์ได้”
“datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze.” McKinsey Global Institute, Publish: 2011

“ข้อมูลที่ใหญ่เสียจน Excel ปริแตก”
“big data is data that breaks Excel” Brian Wilt, Senior Data Scientist, Jawbone

นิยาม Big Data ในแง่การนำไปใช้ประโยชน์

ศาสตร์ของ Business Intelligence คือการนำเอาข้อมูลจากอดีตมาวิเคราะห์เพื่อทำนายหรือคาดการณ์สิ่งที่จะเกิดขึ้นอนาคต โดยอาศัยการค้นหารูปแบบเฉพาะ (Pattern) ที่อยู่ในข้อมูล ยิ่งมีข้อมูลมากขึ้น รูปแบบเฉพาะที่ได้ก็จะมีความแม่นยำมากขึ้น และใช้ทำนายอนาคตได้ดียิ่งขึ้น (ในทางทฤษฎี) และถ้าข้อมูลมีขนาดมหึมาของทั้งประเทศ มันก็สามารถนำมาใช้คาดการณ์พฤติกรรมของคน สังคม เศรษฐกิจ และทุกอย่างที่เกิดขึ้นในประเทศได้ด้วย

ข้างล่างเป็นตัวอย่างผู้ให้คำนิยามของ Big Data ในแง่การนำไปใช้ประโยชน์

“ชุดข้อมูลที่มีขนาดใหญ่มากที่ถูกนำมาวิเคราะห์จนสามารถเผยให้เห็นถึงแบบแผน แนวโน้ม และ ความสัมพันธ์ที่เกี่ยวข้องกับพฤติกรรมและปฏิสัมพันธ์ของมนุษย์”
“extremely large data sets that may be analyzed computationally to reveal patterns, trends, and associations, especially relating to human behavior and interactions.” Google Search, Lastest View: 20180512

“ความสามารถของสังคมที่จะใช้งานข่าวสารในแนวทางใหม่เพื่อที่จะสร้างความเข้าใจหรือสร้างสินค้าและบริการที่มีประโยชน์อย่างมีนัยสำคัญ” และ “หลายสิ่งที่สามารถทำได้กับข้อมูลขนาดใหญ่ที่ข้อมูลขนาดเล็กไม่สามารถทำได้ในการที่จะหาองค์ความรู้ใหม่และคุณประโยชน์รูปแบบใหม่”
“The ability of society to harness information in novel ways to produce useful insights or goods and services of significant value” and “…things one can do at a large scale that cannot be done at a smaller one, to extract new insights or create new forms of value.” Big Data: A Revolution That Will Transform How We Live, Work, and Think

“โอกาสที่จะเพิ่มพูนความเข้าใจอันซับซ้อนของความสัมพันธ์ระหว่างปัจจัยหลายตัวที่แตกต่างกันและเปิดเผยแบบแผนที่ไม่เคยค้นพบก่อนหน้านั้นที่อยู่ในข้อมูล”
“an opportunity to gain a more complex understanding of the relationships between different factors and to uncover previously undetected patterns in data.” Amy Escobar, Data Scientist, 2U, Inc

นิยาม Big Data ในแง่ปรัชญาในการจัดเก็บข้อมูล

หากบริษัทส่งผลิตภัณฑ์ใหม่คุณหนึ่งชิ้น แล้วขอให้คุณทำวิจัย ว่าสินค้าตัวนี้ จะถูกซื้อโดยคนที่มีลักษณะอย่างไร คุณเริ่มงานโดยสร้างแบบฟอร์มขึ้นมา โดยให้ผู้ตอบแบบสอบถามกรอกประวัติส่วนตัว แล้วลงท้ายด้วยการถามว่าเขายินดีจะซื้อสินค้าตัวนี้หรือไม่ จากนั้นถึงนำผลที่ได้มาหาความสัมพันธ์กับประวัติส่วนตัว เพื่อให้ได้ลักษณะของคนที่ยินดีจะซื้อสินค้าตัวนั้น

ปัญหาก็คือประวัติส่วนตัวต้องมีฟิลด์ (Field) อะไรบ้าง จุดนี้คือปัญหาใหญ่ ถ้าโลกแห่งความเป็นจริง ลูกค้าซื้อสินค้าตามอายุ แต่แบบสอบถามไม่มีให้กรอกอายุ คนทำวิจัยก็จะไม่เห็นความจริงในข้อนี้ ปัญหาที่ตามอีกอย่างก็คือ ผู้วัจัยเองก็ไม่รู้ว่าโลกแห่งความจริงว่าเขาซื้อตามอายุจริงหรือไหม

แล้วนักวิจัยควรทำอย่างไร วิธีที่ดีที่สุดที่จะทำได้คือ ให้นักวิจัยใส่ฟิลด์ในแบบสอบถามให้มากที่สุดเท่าที่จะมากได้เกี่ยวกับผู้ตอบแบบสอบถาม จากนั้นถึงค่อยวิเคราะห์ถึงความสัมพัมธ์ระหว่างการซื้อสินค้ากับประวัติส่วนตัว แล้วหวังว่าจะมีซักฟิลด์หนึ่งหรือมากกว่านั้นที่มีความสัมพันธ์กับการตัดสินใจซื้อสินค้า

ทั้งหมดคือตัวอย่างของนิยาม Big Data อีกแบบหนึ่ง ผู้วิจัยไม่รู้แน่นอนว่าสิ่งใดคือ”เหตุ”ที่ทำให้เกิด”ผล” ฉะนั้นจึงตามเก็บข้อมูล”ทุกอย่าง” ที่จัดหามาได้ โดยไม่สนใจว่าข้อมูลที่เก็บนั้นจะสมเหตุสมผลหรือไม่ เพราะนั้นไม่ใช่หน้าที่ของผู้จัดเก็บข้อมูล แต่เป็นหน้าที่ของผู้วิเคราะห์และเครื่องมือที่ใช้วิเคราะห์ที่จะเกิดขึ้นตามมาหลังจากนั้น

ข้างล่างเป็นตัวอย่างผู้ให้คำนิยามของ Big Data ในแง่ปรัชญาในการจัดเก็บข้อมูล

“Big data เป็นการกล่าวถึงการจัดการข้อมูลในลักษณะ “เก็บก่อน ประมวลที่หลัง” หมายความว่า คุณจับและเก็บข้อมูลขนาดใหญ่ของกิจกรรมและการทำรายการในหลากหลายรูปแบบ เพื่อที่จะใช้เป็นพื้นฐานในการที่จะทำความเข้าใจในภายหลัง”
“Big data refers to the approach to data of “collect now, sort out later”…meaning you capture and store data on a very large volume of actions and transactions of different types, on a continuous basis, in order to make sense of it later.” Rohan Deuskar, CEO and Co-Founder, Stylitics

“Big Data คือ ผลลัพธ์ของเก็บรวบรวมข้อมูลจากชิ้นส่วนที่ยิบย่อยที่สุด”
“Big Data is the result of collecting information at its most granular level.” Jon Bruner, Editor-at-Large, O’Reilly Media

“ปรัชญาของการ “เก็บให้หมดก่อน แล้วค่อยถามที่หลัง” ”
“The associated ethos of “store everything now and ask questions later” ” Josh Schwartz, Chief Data Scientist, Chartbeat

นิยาม Big Data ในแง่ของลักษณะ

Doug Laney นักวิเคราะห์แห่งบริษัท Gartner ไม่ได้นิยามว่า Big Data คืออะไร จริงๆแล้วบทความอันโด่งดังของเขาไม่ได้มีคำว่า Big Data ด้วยซ้ำ แต่ทุกคนรู้ว่าเขากำลังพูดถึงอะไร สิ่งที่เขาพูดถึง กลายเป็นบรรทัดฐานในการระบุลักษณะของ Big Data โดย Doug Laney ระบุว่า  Big Data  มีลักษณะจำเพาะ 3 อย่าง คือ Volume, Velocity และ Variety ต่อมาเรียกหลักการนี้ว่า 3V ซึ่งผู้เขียนขออธิบายทั้ง 3V ในบทความอื่น

สรุป

Big Data คืออะไร? มันยังคงเป็นปัญหาปลายเปิดที่ผู้อ่านหรือใครก็ตามบนโลกใบนี้ก็สามารถนิยามเองได้ ตามแต่จะเห็นควรไปตามประสบการณ์ของแต่ละคน

แล้วสำหรับผู้อ่านละ Big Data คืออะไร?

Advertisements

One thought on “Big Data Definition/ นิยามของ Big Data

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s