รหัสโครงการ : | R000000287 |
ชื่อโครงการ (ภาษาไทย) : | การคัดกรองและวิเคราะห์ข้อมูลท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตและเทคนิคการทำเหมืองข้อความ |
ชื่อโครงการ (ภาษาอังกฤษ) : | Tourism Web Filtering and Analysis using Na?ve Bayes with Boundary Values and Text Mining |
คำสำคัญของโครงการ(Keyword) : | สำคัญท่องเที่ยว นาอีฟเบย์ คำที่ปรากฏร่วม การเรียนรู้ เหมืองข้อความ |
หน่วยงานเจ้าของโครงการ : | คณะวิทยาศาสตร์และเทคโนโลยี > ภาควิชาวิทยาศาสตร์ประยุกต์ สาขาวิชาคอมพิวเตอร์ และเทคโนโลยีสารสนเทศ |
ลักษณะโครงการวิจัย : | โครงการวิจัยเดี่ยว |
ลักษณะย่อยโครงการวิจัย : | ไม่อยู่ภายใต้แผนงานวิจัย/ชุดโครงการวิจัย |
ประเภทโครงการ : | โครงการวิจัยใหม่ |
สถานะของโครงการ : | propersal |
งบประมาณที่เสนอขอ : | 82000 |
งบประมาณทั้งโครงการ : | 82,000.00 บาท |
วันเริ่มต้นโครงการ : | 01 ตุลาคม 2559 |
วันสิ้นสุดโครงการ : | 30 กันยายน 2561 |
ประเภทของโครงการ : | งานวิจัยประยุกต์ |
กลุ่มสาขาวิชาการ : | วิทยาศาสตร์ธรรมชาติ |
สาขาวิชาการ : | สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์ |
กลุ่มวิชาการ : | วิทยาการคอมพิวเตอร์ |
ลักษณะโครงการวิจัย : | ระดับชาติ |
สะท้อนถึงการใช้ความรู้เชิงอัตลักษณ์ : | สะท้อนถึงการใช้ความรู้เชิงอัตลักษณ์ |
สร้างความร่วมมือประหว่างประเทศ GMS : | ไม่สร้างความร่วมมือทางการวิจัยระหว่างประเทศ |
นำไปใช้ในการพัฒนาคุณภาพการศึกษา : | ไม่นำไปใช้ประโยชน์ในการพัฒนาณภาพการศึกษา |
เกิดจากความร่วมมือกับภาคการผลิต : | ไม่เกิดจากความร่วมมือกับภาคการผลิต |
ความสำคัญและที่มาของปัญหา : | ปัจจุบันการสืบค้นข้อมูลออนไลน์ผู้ใช้ส่วนใหญ่จะสืบค้นผ่านเว็บเสิร์ชเอนจิน แต่ข้อมูลที่ได้จากการสืบค้นมีจำนวนมาก ไม่ถูกจัดหมวดหมู่และมีข้อมูลที่ไม่ต้องการปะปนอยู่ทำให้เสียเวลาในการคัดเลือกข้อมูลให้ตรงกับความต้องการทั้งหมด (Cao and Nguyen, 2012; Panawong et al., 2014) และผู้พัฒนาเว็บไซต์ก็มีความต้องการให้ผลลัพธ์จากการสืบค้นอยู่ในอันดับต้น ๆ หรือติดอยู่ในหน้าแรกของเว็บเสิร์ชเอนจิน ทั้งนี้เพื่อเป็นการเปิดโอกาสการเข้าถึงเว็บไซต์หรือทำให้มีผู้เข้าชมเว็บไซต์เพิ่มมากขึ้นหรือมียอดขายสินค้าเพิ่มมากขึ้น ซึ่งผู้พัฒนาจะใช้วิธีการใส่คำสำคัญไว้ตาม Tags ต่าง ๆ เช่น Title, Body เป็นต้น สอดคล้องกับพฤติกรรมของผู้ใช้ที่จะคลิกเพื่อเข้าไปอ่านเนื้อหาของเว็บไซต์ 10-20 ลำดับแรกของผลลัพธ์จากการสืบค้นเท่านั้น (Lu and Cong, 2015) แต่อย่างไรก็ตามผู้พัฒนาเว็บไซต์อาจไม่รู้ว่าจะใช้คำสำคัญอะไรบ้างเพื่อให้ผลลัพธ์จากการสืบค้นอยู่ในลำดับที่ดีได้ ทำให้เสียเวลาทดลองหาคำสำคัญที่เหมาะสม (Deka, 2014; Vignesh and Deepa, 2014) โดยคำสำคัญที่ใช้นั้นอาจประกอบด้วย คำ 1 คำ หรือมากกว่า 1 คำในรูปแบบของประโยคหรือใช้คำสำคัญในการแบ่งแยกเอกสารให้เป็นหมวดหมู่หรือใช้สำหรับสืบค้นข้อมูลตามความสนใจ (Jain and Sharma, 2012; Ozbal et al., 2014)
ในการใช้คำสำคัญเพื่อวิเคราะห์ข้อมูลหรือจัดหมวดหมู่นั้น มีงานวิจัยจากนักวิจัยต่าง ๆ เช่น งานวิจัยของ Namahoot et al. (2015) ได้นำเสนอการใช้คำสำคัญในการวิเคราะห์กลุ่มข้อมูลท่องเที่ยวและจัดหมวดหมู่เว็บไซต์ท่องเที่ยวจำนวน 500 เว็บไซต์ด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต แบ่งเป็น 6 หมวดหมู่ คือ สถานที่ท่องเที่ยว ที่พัก ร้านอาหาร ร้านขายของฝาก ร้านหนึ่งตำบลหนึ่งผลิตภัณฑ์และเทศกาล ส่วนงานวิจัยของวิชุดา โชติรัตน์ และคณะ (2554) ใช้คำสำคัญในการวิเคราะห์ข่าวออนไลน์ที่เกี่ยวข้องกับพื้นที่ 5 จังหวัดชายแดนใต้เพื่อแยกองค์ประกอบสำคัญในเนื้อหาข่าว คือ บุคคลที่เกี่ยวข้อง สถานที่เกิดเหตุ อาวุธที่ใช้ ผลลกระทบ รูปแบบเหตุการณ์และเวลาที่เกิดเหตุ ในขณะที่งานวิจัยของ Tosqui-Lucks and Silva (2012) ได้สร้างฐานความรู้ในรูปแบบออนโทโลจีท่องเที่ยวโดยมีคำศัพท์ต่าง ๆ ที่เกี่ยวข้องกับการท่องเที่ยวเป็นภาษาอังกฤษและใช้คำสำคัญท่องเที่ยวเหล่านั้นไปจัดหมวดหมู่เว็บไซต์ โดยแยกเป็นสถานที่ท่องเที่ยว ที่พัก ร้านอาหารและการเดินทาง และงานวิจัยของ Namahoot et al. (2014) ได้นำเสนอการใช้เทคนิคการจัดกลุ่มข้อมูลเว็บไซต์ท่องเที่ยวจำนวน 200 เว็บไซต์ โดยคำนวณหาความถี่และค่าน้ำหนักของคำสำคัญท่องเที่ยวในส่วนต่าง ๆ ของแต่ละเว็บไซต์ท่องเที่ยว ซึ่งแบ่งเป็น 31 รูปแบบ และจากการทดลองพบว่าเนื้อหาส่วน Body มีความสำคัญต่อการจัดกลุ่มข้อมูลท่องเที่ยวมากที่สุด
จากปัญหาและจากงานวิจัยต่าง ๆ ที่ได้กล่าวมานั้น ผู้วิจัยจึงมีแนวคิดที่จะวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความโดยคำนวณหาค่าความถี่ของคำแล้วนำมาวิเคราะห์คำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการสืบค้นข้อมูลท่องเที่ยวที่ให้ผลลัพธ์ที่ตรงกับความต้องการของผู้ใช้หรือส่งผลต่อการสืบค้นข้อมูลท่องเที่ยว โดยผู้วิจัยจะประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตคัดกรองข้อมูลเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว อีกทั้งจะใช้ Apriori Algorithm และพัฒนาอัลกอริทึมหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว ทั้งนี้เพื่อหากลุ่มคำสำคัญที่ปรากฏร่วมกัน จากนั้นนำไปทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว ซึ่งผลลัพธ์ที่ได้จากการทำวิจัยครั้งนี้จะทำให้ได้กลุ่มของคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ เช่น กูเกิ้ล (Google) บิง (Bing) และยาฮู (Yahoo) เป็นต้น โดยสามารถนำไปประยุกต์ใช้ในการเรียนรู้คำสำคัญที่จำเป็นต้องมีในเนื้อหาของเว็บไซต์ต่าง ๆ ได้อีกด้วย |
จุดเด่นของโครงการ : | - |
วัตถุประสงค์ของโครงการ : | 1. เพื่อคัดกรองข้อมูลเว็บไซต์ที่เกี่ยวกับการท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต
2. เพื่อวิเคราะห์คำสำคัญท่องเที่ยวโดยใช้เทคนิคการทำเหมืองข้อความ
3. เพื่อพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยวได้
4. เพื่อเปรียบเทียบประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยวที่ได้จากการพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวกับอัลกอริทึมอื่น ๆ |
ขอบเขตของโครงการ : | ในงานวิจัยครั้งนี้ผู้วิจัยได้จะทำจัดเก็บข้อมูลเว็บไซต์และพัฒนาอัลกอริทึม ดังรายละเอียดต่อไปนี้
1. ด้านข้อมูล ผู้วิจัยจะใช้ผลลัพธ์ของการสืบค้นข้อมูลท่องเที่ยวจากเว็บไซต์กูเกิ้ล โดยใช้คำค้นหาเป็นชื่อจังหวัดพิษณุโลกและอีก 10 จังหวัดที่นิยมท่องเที่ยวในประเทศไทย คือ เชียงใหม่ ภูเก็ต กระบี่ เชียงราย ชลบุรี แม่ฮ่องสอน ประจวบคีรีขันธ์ สุราษฎร์ธานี ระยอง และเลย (กรมการท่องเที่ยว, 2559) รวมถึงใช้ชื่อหมวดหมู่จำนวน 3 หมวดหมู่ (สถานที่ท่องเที่ยว, ที่พัก, ร้านอาหาร) กับชื่อจังหวัด ไปสืบค้นข้อมูลท่องเที่ยวจากเว็บไซต์กูเกิ้ล เช่น ท่องเที่ยวเชียงใหม่ ที่พักเชียงใหม่ ร้านอาหารเชียงใหม่ เป็นต้น จากกระบวนการนี้จะทำให้ได้รายชื่อเว็บไซต์ต่าง ๆ ซึ่งผลลัพธ์ที่ได้จากการสืบค้นจะถูกจัดเก็บลงฐานข้อมูล MySQL
2. ด้านอัลกอริทึม ผู้วิจัยจะประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตจากงานวิจัยของ Namahoot et al. (2015) เพื่อคัดกรองเฉพาะข้อมูลเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยวเท่านั้น และใช้เทคนิคการทำเหมืองข้อความในการวิเคราะห์คำสำคัญท่องเที่ยว โดยผู้วิจัยจะพัฒนาอัลกอริทึมหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว โดยใช้ภาษา Java ในการพัฒนา อีกทั้งจะประยุกต์ใช้ Apriori Algorithm ในการหาคำสำคัญที่ปรากฏร่วมกันบ่อยเพื่อนำมาเปรียบเทียบกับอัลกอริทึมที่ผู้วิจัยพัฒนาขึ้น
3. ด้านการทดสอบ ผู้วิจัยจะทำการทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว โดยทำการเปรียบเทียบประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยวที่ได้จากการทำงานของ Apriori Algorithm กับอัลกอริทึมที่ผู้วิจัยพัฒนาเอง |
ผลที่คาดว่าจะได้รับ : | 1. ได้อัลกอริทึมที่สามารถหากลุ่มคำสำคัญท่องเที่ยวที่มีประสิทธิภาพ
2. ได้กลุ่มคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก
3. เมื่อนำคำสำคัญท่องเที่ยวที่ได้ไปใช้จะทำให้มีจำนวนผู้เข้าชมเว็บไซต์เพิ่มมากขึ้น
4. ลดเวลาในค้นหากลุ่มคำสำคัญท่องเที่ยวที่จะนำไปใส่ในเว็บไซต์
5. สามารถนำไปประยุกต์ใช้เรียนรู้กับโดเมนอื่น ๆ ได้
10.6 ได้ผลงานวิชาการที่สามารถนำไปเขียนเป็นบทความทางวิชาการหรือเผยแพร่ในงานวิจัยระดับชาติหรือนานาชาติอย่างน้อย 1 บทความ |
การทบทวนวรรณกรรม/สารสนเทศ : | เว็บเสิร์ชเอนจินในปัจจุบันยังใช้วิธีการสืบค้นข้อมูลโดยใช้คำสำคัญ เมื่อผู้ใช้ระบุคำสำคัญเข้าไปในเว็บเสิร์ชเอนจิน ระบบจะทำการพิจารณาความเกี่ยวข้องกันระหว่างคำสำคัญของผู้ใช้กับข้อมูลที่เก็บไว้ในฐานข้อมูลหรือฐานความรู้ เมื่อพบข้อมูลที่เกี่ยวข้องกับคำสำคัญเหล่านั้นแล้ว ระบบจะทำการดึงข้อมูลมาเป็นผลลัพธ์และคำนวณหาค่าความคล้ายคลึงกันระหว่างคำสำคัญและข้อมูลนั้น ๆ ก่อนที่จะแสดงผลลัพธ์ของการค้นหาต่อผู้ใช้ ซึ่งผลลัพธ์จากการสืบค้นจะถูกเรียงลำดับตามค่าความคล้ายคลึงกันจากมากไปหาน้อยและปกติผู้ใช้จะพิจารณาข้อมูลลำดับต้น ๆ ของผลลัพธ์ก่อนเสมอ (ไกรศักดิ์ เกษร, 2554) โดยคำสำคัญยังถูกนำไปใช้กับงานวิจัยต่าง ๆ เช่น การจำแนกเอกสารหรือจัดหมวดหมู่เว็บไซต์ (นฤพนธ์ พนาวงศ์ และจักรกฤษณ์ เสน่ห์ นมะหุต, 2558; Namahoot et al. , 2014; 2015; Onan et al., 2016) การวิเคราะห์ข่าว (วิชุดา โชติรัตน์ และคณะ, 2554) การโฆษณาทีวี (Joo et al., 2016) และวิเคราะห์เว็บไซต์ (Kharad and Kulkarni, 2014) เป็นต้น
สำหรับเทคนิคการทำเหมืองข้อความถูกประยุกต์ใช้กับงานวิจัยต่าง ๆ เช่น ใช้เทคนิคการทำเหมืองข้อความสำหรับการจำแนกข่าวภาษาอังกฤษด้านอาชญากรรมออนไลน์ (ทิชากร เนตรสุวรรณ์ และ ไกรศักดิ์ เกษร, 2558) การรีวิวคำวิจารณ์ของลูกค้าที่เข้ามาใช้บริการโรงแรม 2,510 โรงแรม (Berezina et al, 2015) การรีวิวเครื่องมือที่ใช้ในงานวิจัยของนักศึกษา (O’Mara-Eves et al., 2015) การวิเคราะห์ข้อมูลพาดหัวข่าวเพื่อทำนายทิศทางด้านการตลาด (Nassirtoussi et al., 2015) และการวิเคราะห์สิทธิบัตร (Noh et al., 2015) เป็นต้น
จากการทบทวนวรรณกรรมและงานวิจัยที่เกี่ยวข้องดังที่ได้กล่าวมาข้างต้นแล้วนั้น ผู้วิจัยจึงมีแนวความคิดที่จะทำการวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ โดยประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตจากงานวิจัยของ Namahoot et al. (2015) มาทำการคัดกรองข้อมูลเอาเฉพาะเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว เพื่อให้ได้กลุ่มของคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ เช่น กูเกิ้ล (Google) บิง (Bing) และยาฮู (Yahoo) เป็นต้น |
ทฤษฎี สมมุติฐาน กรอบแนวความคิด : | 1. ขั้นตอนในการเตรียมข้อมูลเว็บไซต์ท่องเที่ยว โดยนำเว็บไซต์ที่ได้จากการสืบค้นจากเว็บไซต์กูเกิ้ลด้วยชื่อจังหวัด 11 จังหวัด และ ชื่อจังหวัด 11 จังหวัด + ชื่อหมวดหมู่ (สถานที่ท่องเที่ยว ที่พัก และร้านอาหาร) เช่น “เชียงใหม่”, “ท่องเที่ยว เชียงใหม่”, “ร้านอาหาร เชียงใหม่” เป็นต้น และจัดเก็บลงฐานข้อมูล
2. นำรายชื่อเว็บไซต์ที่ได้จากข้อที่ 1 มาดึงเนื้อหาของเว็บไซต์และทำการตัด HTML Tags ตัดคำหยุดหรือคำที่ไม่สื่อความหมายออก
3. นำเนื้อหาเว็บไซต์ที่ได้จากข้อที่ 2 มาทำการคัดกรองเฉพาะเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว ซึ่งผู้วิจัยใช้วิธีการหมวดหมู่เว็บไซต์ท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต และเว็บไซต์ที่สามารถจัดหมวดหมู่เว็บไซต์ท่องเที่ยวได้ จะถือได้ว่า เป็นเว็บไซต์เหล่านั้นเป็นเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยวเช่นกัน
4. ผลลัพธ์ที่ได้จากการทำงานในข้อที่ 3 จะได้เว็บไซต์ที่เกี่ยวข้องกับท่องเที่ยว จากนั้นจะถูกนำไปวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ
5. ประยุกต์ใช้อัลกอริทึม Apriori และพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว พร้อมทดสอบกลุ่มคำสำคัญท่องเที่ยวที่ให้ค่าประสิทธิภาพดีที่สุด โดยแบ่งข้อมูลออกเป็น 2 ส่วน คือ ข้อมูลที่ใช้สำหรับการเรียนรู้คำสำคัญท่องเที่ยว และข้อมูลที่ใช้สำหรับทดสอบการทำงาน ซึ่งขั้นตอนการทดสอบนี้จะใช้คำสำคัญท่องเที่ยวที่ได้จากการเรียนรู้ มาเปรียบเทียบกับคำสำคัญท่องเที่ยวที่นำมาจากออนโทโลจีท่องเที่ยวของ Panawong et al. (2012) ซึ่งผลลัพธ์ที่ได้จากการทำวิจัยครั้งนี้จะทำให้ได้คำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ ได้ |
วิธีการดำเนินการวิจัย และสถานที่ทำการทดลอง/เก็บข้อมูล : | ในงานวิจัยครั้งนี้ผู้วิจัยได้ลำดับขั้นตอนของการดำเนินงานวิจัยไว้ ซึ่งมีรายละเอียดดังต่อไปนี้
1. ศึกษาเอกสารข้อมูลและงานวิจัยที่เกี่ยวข้อง
2. จัดเก็บข้อมูล
3. คัดกรองเฉพาะข้อมูลที่เกี่ยวข้องกับการท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต
4. วิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ
5. ประยุกต์ใช้อัลกอริทึม Apriori และพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว
6. ทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว
7. สรุปผล อภิปรายผล และข้อเสนอแนะ รวมทั้งจัดทำรูปเล่มรายงาน |
คำอธิบายโครงการวิจัย (อย่างย่อ) : | - |
จำนวนเข้าชมโครงการ : | 378 ครั้ง |