รายละเอียดโครงการวิจัย
กลับไปหน้าโครงการวิจัยทั้งหมด

รหัสโครงการ :R000000287
ชื่อโครงการ (ภาษาไทย) :การคัดกรองและวิเคราะห์ข้อมูลท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตและเทคนิคการทำเหมืองข้อความ
ชื่อโครงการ (ภาษาอังกฤษ) :Tourism Web Filtering and Analysis using Na?ve Bayes with Boundary Values and Text Mining
คำสำคัญของโครงการ(Keyword) :สำคัญท่องเที่ยว นาอีฟเบย์ คำที่ปรากฏร่วม การเรียนรู้ เหมืองข้อความ
หน่วยงานเจ้าของโครงการ :คณะวิทยาศาสตร์และเทคโนโลยี > ภาควิชาวิทยาศาสตรประยุกต์ สาขาวิชาคอมพิวเตอร์ และเทคโนโลยีสารสนเทศ
ลักษณะโครงการวิจัย :โครงการวิจัยเดี่ยว
ลักษณะย่อยโครงการวิจัย :ไม่อยู่ภายใต้แผนงานวิจัย/ชุดโครงการวิจัย
ประเภทโครงการ :โครงการวิจัยใหม่
สถานะของโครงการ :propersal
งบประมาณที่เสนอขอ :82000
งบประมาณทั้งโครงการ :82,000.00 บาท
วันเริ่มต้นโครงการ :01 ตุลาคม 2559
วันสิ้นสุดโครงการ :30 กันยายน 2561
ประเภทของโครงการ :งานวิจัยประยุกต์
กลุ่มสาขาวิชาการ :วิทยาศาสตร์ธรรมชาติ
สาขาวิชาการ :สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์
กลุ่มวิชาการ :วิทยาการคอมพิวเตอร์
ลักษณะโครงการวิจัย :ระดับชาติ
สะท้อนถึงการใช้ความรู้เชิงอัตลักษณ์ : สะท้อนถึงการใช้ความรู้เชิงอัตลักษณ์
สร้างความร่วมมือประหว่างประเทศ GMS : ไม่สร้างความร่วมมือทางการวิจัยระหว่างประเทศ
นำไปใช้ในการพัฒนาคุณภาพการศึกษา :ไม่นำไปใช้ประโยชน์ในการพัฒนาณภาพการศึกษา
เกิดจากความร่วมมือกับภาคการผลิต : ไม่เกิดจากความร่วมมือกับภาคการผลิต
ความสำคัญและที่มาของปัญหา :ปัจจุบันการสืบค้นข้อมูลออนไลน์ผู้ใช้ส่วนใหญ่จะสืบค้นผ่านเว็บเสิร์ชเอนจิน แต่ข้อมูลที่ได้จากการสืบค้นมีจำนวนมาก ไม่ถูกจัดหมวดหมู่และมีข้อมูลที่ไม่ต้องการปะปนอยู่ทำให้เสียเวลาในการคัดเลือกข้อมูลให้ตรงกับความต้องการทั้งหมด (Cao and Nguyen, 2012; Panawong et al., 2014) และผู้พัฒนาเว็บไซต์ก็มีความต้องการให้ผลลัพธ์จากการสืบค้นอยู่ในอันดับต้น ๆ หรือติดอยู่ในหน้าแรกของเว็บเสิร์ชเอนจิน ทั้งนี้เพื่อเป็นการเปิดโอกาสการเข้าถึงเว็บไซต์หรือทำให้มีผู้เข้าชมเว็บไซต์เพิ่มมากขึ้นหรือมียอดขายสินค้าเพิ่มมากขึ้น ซึ่งผู้พัฒนาจะใช้วิธีการใส่คำสำคัญไว้ตาม Tags ต่าง ๆ เช่น Title, Body เป็นต้น สอดคล้องกับพฤติกรรมของผู้ใช้ที่จะคลิกเพื่อเข้าไปอ่านเนื้อหาของเว็บไซต์ 10-20 ลำดับแรกของผลลัพธ์จากการสืบค้นเท่านั้น (Lu and Cong, 2015) แต่อย่างไรก็ตามผู้พัฒนาเว็บไซต์อาจไม่รู้ว่าจะใช้คำสำคัญอะไรบ้างเพื่อให้ผลลัพธ์จากการสืบค้นอยู่ในลำดับที่ดีได้ ทำให้เสียเวลาทดลองหาคำสำคัญที่เหมาะสม (Deka, 2014; Vignesh and Deepa, 2014) โดยคำสำคัญที่ใช้นั้นอาจประกอบด้วย คำ 1 คำ หรือมากกว่า 1 คำในรูปแบบของประโยคหรือใช้คำสำคัญในการแบ่งแยกเอกสารให้เป็นหมวดหมู่หรือใช้สำหรับสืบค้นข้อมูลตามความสนใจ (Jain and Sharma, 2012; Ozbal et al., 2014) ในการใช้คำสำคัญเพื่อวิเคราะห์ข้อมูลหรือจัดหมวดหมู่นั้น มีงานวิจัยจากนักวิจัยต่าง ๆ เช่น งานวิจัยของ Namahoot et al. (2015) ได้นำเสนอการใช้คำสำคัญในการวิเคราะห์กลุ่มข้อมูลท่องเที่ยวและจัดหมวดหมู่เว็บไซต์ท่องเที่ยวจำนวน 500 เว็บไซต์ด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต แบ่งเป็น 6 หมวดหมู่ คือ สถานที่ท่องเที่ยว ที่พัก ร้านอาหาร ร้านขายของฝาก ร้านหนึ่งตำบลหนึ่งผลิตภัณฑ์และเทศกาล ส่วนงานวิจัยของวิชุดา โชติรัตน์ และคณะ (2554) ใช้คำสำคัญในการวิเคราะห์ข่าวออนไลน์ที่เกี่ยวข้องกับพื้นที่ 5 จังหวัดชายแดนใต้เพื่อแยกองค์ประกอบสำคัญในเนื้อหาข่าว คือ บุคคลที่เกี่ยวข้อง สถานที่เกิดเหตุ อาวุธที่ใช้ ผลลกระทบ รูปแบบเหตุการณ์และเวลาที่เกิดเหตุ ในขณะที่งานวิจัยของ Tosqui-Lucks and Silva (2012) ได้สร้างฐานความรู้ในรูปแบบออนโทโลจีท่องเที่ยวโดยมีคำศัพท์ต่าง ๆ ที่เกี่ยวข้องกับการท่องเที่ยวเป็นภาษาอังกฤษและใช้คำสำคัญท่องเที่ยวเหล่านั้นไปจัดหมวดหมู่เว็บไซต์ โดยแยกเป็นสถานที่ท่องเที่ยว ที่พัก ร้านอาหารและการเดินทาง และงานวิจัยของ Namahoot et al. (2014) ได้นำเสนอการใช้เทคนิคการจัดกลุ่มข้อมูลเว็บไซต์ท่องเที่ยวจำนวน 200 เว็บไซต์ โดยคำนวณหาความถี่และค่าน้ำหนักของคำสำคัญท่องเที่ยวในส่วนต่าง ๆ ของแต่ละเว็บไซต์ท่องเที่ยว ซึ่งแบ่งเป็น 31 รูปแบบ และจากการทดลองพบว่าเนื้อหาส่วน Body มีความสำคัญต่อการจัดกลุ่มข้อมูลท่องเที่ยวมากที่สุด จากปัญหาและจากงานวิจัยต่าง ๆ ที่ได้กล่าวมานั้น ผู้วิจัยจึงมีแนวคิดที่จะวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความโดยคำนวณหาค่าความถี่ของคำแล้วนำมาวิเคราะห์คำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการสืบค้นข้อมูลท่องเที่ยวที่ให้ผลลัพธ์ที่ตรงกับความต้องการของผู้ใช้หรือส่งผลต่อการสืบค้นข้อมูลท่องเที่ยว โดยผู้วิจัยจะประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตคัดกรองข้อมูลเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว อีกทั้งจะใช้ Apriori Algorithm และพัฒนาอัลกอริทึมหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว ทั้งนี้เพื่อหากลุ่มคำสำคัญที่ปรากฏร่วมกัน จากนั้นนำไปทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว ซึ่งผลลัพธ์ที่ได้จากการทำวิจัยครั้งนี้จะทำให้ได้กลุ่มของคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ เช่น กูเกิ้ล (Google) บิง (Bing) และยาฮู (Yahoo) เป็นต้น โดยสามารถนำไปประยุกต์ใช้ในการเรียนรู้คำสำคัญที่จำเป็นต้องมีในเนื้อหาของเว็บไซต์ต่าง ๆ ได้อีกด้วย
จุดเด่นของโครงการ :-
วัตถุประสงค์ของโครงการ :1. เพื่อคัดกรองข้อมูลเว็บไซต์ที่เกี่ยวกับการท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต 2. เพื่อวิเคราะห์คำสำคัญท่องเที่ยวโดยใช้เทคนิคการทำเหมืองข้อความ 3. เพื่อพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยวได้ 4. เพื่อเปรียบเทียบประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยวที่ได้จากการพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวกับอัลกอริทึมอื่น ๆ
ขอบเขตของโครงการ :ในงานวิจัยครั้งนี้ผู้วิจัยได้จะทำจัดเก็บข้อมูลเว็บไซต์และพัฒนาอัลกอริทึม ดังรายละเอียดต่อไปนี้ 1. ด้านข้อมูล ผู้วิจัยจะใช้ผลลัพธ์ของการสืบค้นข้อมูลท่องเที่ยวจากเว็บไซต์กูเกิ้ล โดยใช้คำค้นหาเป็นชื่อจังหวัดพิษณุโลกและอีก 10 จังหวัดที่นิยมท่องเที่ยวในประเทศไทย คือ เชียงใหม่ ภูเก็ต กระบี่ เชียงราย ชลบุรี แม่ฮ่องสอน ประจวบคีรีขันธ์ สุราษฎร์ธานี ระยอง และเลย (กรมการท่องเที่ยว, 2559) รวมถึงใช้ชื่อหมวดหมู่จำนวน 3 หมวดหมู่ (สถานที่ท่องเที่ยว, ที่พัก, ร้านอาหาร) กับชื่อจังหวัด ไปสืบค้นข้อมูลท่องเที่ยวจากเว็บไซต์กูเกิ้ล เช่น ท่องเที่ยวเชียงใหม่ ที่พักเชียงใหม่ ร้านอาหารเชียงใหม่ เป็นต้น จากกระบวนการนี้จะทำให้ได้รายชื่อเว็บไซต์ต่าง ๆ ซึ่งผลลัพธ์ที่ได้จากการสืบค้นจะถูกจัดเก็บลงฐานข้อมูล MySQL 2. ด้านอัลกอริทึม ผู้วิจัยจะประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตจากงานวิจัยของ Namahoot et al. (2015) เพื่อคัดกรองเฉพาะข้อมูลเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยวเท่านั้น และใช้เทคนิคการทำเหมืองข้อความในการวิเคราะห์คำสำคัญท่องเที่ยว โดยผู้วิจัยจะพัฒนาอัลกอริทึมหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว โดยใช้ภาษา Java ในการพัฒนา อีกทั้งจะประยุกต์ใช้ Apriori Algorithm ในการหาคำสำคัญที่ปรากฏร่วมกันบ่อยเพื่อนำมาเปรียบเทียบกับอัลกอริทึมที่ผู้วิจัยพัฒนาขึ้น 3. ด้านการทดสอบ ผู้วิจัยจะทำการทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว โดยทำการเปรียบเทียบประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยวที่ได้จากการทำงานของ Apriori Algorithm กับอัลกอริทึมที่ผู้วิจัยพัฒนาเอง
ผลที่คาดว่าจะได้รับ :1. ได้อัลกอริทึมที่สามารถหากลุ่มคำสำคัญท่องเที่ยวที่มีประสิทธิภาพ 2. ได้กลุ่มคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก 3. เมื่อนำคำสำคัญท่องเที่ยวที่ได้ไปใช้จะทำให้มีจำนวนผู้เข้าชมเว็บไซต์เพิ่มมากขึ้น 4. ลดเวลาในค้นหากลุ่มคำสำคัญท่องเที่ยวที่จะนำไปใส่ในเว็บไซต์ 5. สามารถนำไปประยุกต์ใช้เรียนรู้กับโดเมนอื่น ๆ ได้ 10.6 ได้ผลงานวิชาการที่สามารถนำไปเขียนเป็นบทความทางวิชาการหรือเผยแพร่ในงานวิจัยระดับชาติหรือนานาชาติอย่างน้อย 1 บทความ
การทบทวนวรรณกรรม/สารสนเทศ :เว็บเสิร์ชเอนจินในปัจจุบันยังใช้วิธีการสืบค้นข้อมูลโดยใช้คำสำคัญ เมื่อผู้ใช้ระบุคำสำคัญเข้าไปในเว็บเสิร์ชเอนจิน ระบบจะทำการพิจารณาความเกี่ยวข้องกันระหว่างคำสำคัญของผู้ใช้กับข้อมูลที่เก็บไว้ในฐานข้อมูลหรือฐานความรู้ เมื่อพบข้อมูลที่เกี่ยวข้องกับคำสำคัญเหล่านั้นแล้ว ระบบจะทำการดึงข้อมูลมาเป็นผลลัพธ์และคำนวณหาค่าความคล้ายคลึงกันระหว่างคำสำคัญและข้อมูลนั้น ๆ ก่อนที่จะแสดงผลลัพธ์ของการค้นหาต่อผู้ใช้ ซึ่งผลลัพธ์จากการสืบค้นจะถูกเรียงลำดับตามค่าความคล้ายคลึงกันจากมากไปหาน้อยและปกติผู้ใช้จะพิจารณาข้อมูลลำดับต้น ๆ ของผลลัพธ์ก่อนเสมอ (ไกรศักดิ์ เกษร, 2554) โดยคำสำคัญยังถูกนำไปใช้กับงานวิจัยต่าง ๆ เช่น การจำแนกเอกสารหรือจัดหมวดหมู่เว็บไซต์ (นฤพนธ์ พนาวงศ์ และจักรกฤษณ์ เสน่ห์ นมะหุต, 2558; Namahoot et al. , 2014; 2015; Onan et al., 2016) การวิเคราะห์ข่าว (วิชุดา โชติรัตน์ และคณะ, 2554) การโฆษณาทีวี (Joo et al., 2016) และวิเคราะห์เว็บไซต์ (Kharad and Kulkarni, 2014) เป็นต้น สำหรับเทคนิคการทำเหมืองข้อความถูกประยุกต์ใช้กับงานวิจัยต่าง ๆ เช่น ใช้เทคนิคการทำเหมืองข้อความสำหรับการจำแนกข่าวภาษาอังกฤษด้านอาชญากรรมออนไลน์ (ทิชากร เนตรสุวรรณ์ และ ไกรศักดิ์ เกษร, 2558) การรีวิวคำวิจารณ์ของลูกค้าที่เข้ามาใช้บริการโรงแรม 2,510 โรงแรม (Berezina et al, 2015) การรีวิวเครื่องมือที่ใช้ในงานวิจัยของนักศึกษา (O’Mara-Eves et al., 2015) การวิเคราะห์ข้อมูลพาดหัวข่าวเพื่อทำนายทิศทางด้านการตลาด (Nassirtoussi et al., 2015) และการวิเคราะห์สิทธิบัตร (Noh et al., 2015) เป็นต้น จากการทบทวนวรรณกรรมและงานวิจัยที่เกี่ยวข้องดังที่ได้กล่าวมาข้างต้นแล้วนั้น ผู้วิจัยจึงมีแนวความคิดที่จะทำการวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ โดยประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตจากงานวิจัยของ Namahoot et al. (2015) มาทำการคัดกรองข้อมูลเอาเฉพาะเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว เพื่อให้ได้กลุ่มของคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ เช่น กูเกิ้ล (Google) บิง (Bing) และยาฮู (Yahoo) เป็นต้น
ทฤษฎี สมมุติฐาน กรอบแนวความคิด :1. ขั้นตอนในการเตรียมข้อมูลเว็บไซต์ท่องเที่ยว โดยนำเว็บไซต์ที่ได้จากการสืบค้นจากเว็บไซต์กูเกิ้ลด้วยชื่อจังหวัด 11 จังหวัด และ ชื่อจังหวัด 11 จังหวัด + ชื่อหมวดหมู่ (สถานที่ท่องเที่ยว ที่พัก และร้านอาหาร) เช่น “เชียงใหม่”, “ท่องเที่ยว เชียงใหม่”, “ร้านอาหาร เชียงใหม่” เป็นต้น และจัดเก็บลงฐานข้อมูล 2. นำรายชื่อเว็บไซต์ที่ได้จากข้อที่ 1 มาดึงเนื้อหาของเว็บไซต์และทำการตัด HTML Tags ตัดคำหยุดหรือคำที่ไม่สื่อความหมายออก 3. นำเนื้อหาเว็บไซต์ที่ได้จากข้อที่ 2 มาทำการคัดกรองเฉพาะเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว ซึ่งผู้วิจัยใช้วิธีการหมวดหมู่เว็บไซต์ท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต และเว็บไซต์ที่สามารถจัดหมวดหมู่เว็บไซต์ท่องเที่ยวได้ จะถือได้ว่า เป็นเว็บไซต์เหล่านั้นเป็นเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยวเช่นกัน 4. ผลลัพธ์ที่ได้จากการทำงานในข้อที่ 3 จะได้เว็บไซต์ที่เกี่ยวข้องกับท่องเที่ยว จากนั้นจะถูกนำไปวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ 5. ประยุกต์ใช้อัลกอริทึม Apriori และพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว พร้อมทดสอบกลุ่มคำสำคัญท่องเที่ยวที่ให้ค่าประสิทธิภาพดีที่สุด โดยแบ่งข้อมูลออกเป็น 2 ส่วน คือ ข้อมูลที่ใช้สำหรับการเรียนรู้คำสำคัญท่องเที่ยว และข้อมูลที่ใช้สำหรับทดสอบการทำงาน ซึ่งขั้นตอนการทดสอบนี้จะใช้คำสำคัญท่องเที่ยวที่ได้จากการเรียนรู้ มาเปรียบเทียบกับคำสำคัญท่องเที่ยวที่นำมาจากออนโทโลจีท่องเที่ยวของ Panawong et al. (2012) ซึ่งผลลัพธ์ที่ได้จากการทำวิจัยครั้งนี้จะทำให้ได้คำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ ได้
วิธีการดำเนินการวิจัย และสถานที่ทำการทดลอง/เก็บข้อมูล :ในงานวิจัยครั้งนี้ผู้วิจัยได้ลำดับขั้นตอนของการดำเนินงานวิจัยไว้ ซึ่งมีรายละเอียดดังต่อไปนี้ 1. ศึกษาเอกสารข้อมูลและงานวิจัยที่เกี่ยวข้อง 2. จัดเก็บข้อมูล 3. คัดกรองเฉพาะข้อมูลที่เกี่ยวข้องกับการท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต 4. วิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ 5. ประยุกต์ใช้อัลกอริทึม Apriori และพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว 6. ทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว 7. สรุปผล อภิปรายผล และข้อเสนอแนะ รวมทั้งจัดทำรูปเล่มรายงาน
คำอธิบายโครงการวิจัย (อย่างย่อ) :-
จำนวนเข้าชมโครงการ :328 ครั้ง
รายชื่อนักวิจัยในโครงการ
ชื่อนักวิจัยประเภทนักวิจัยบทบาทหน้าที่นักวิจัยสัดส่วนปริมาณงาน(%)
ดร.นฤพนธ์ พนาวงศ์ บุคลากรภายในมหาวิทยาลัยหัวหน้าโครงการวิจัย100

กลับไปหน้าโครงการวิจัยทั้งหมด