Defence Technology Institute Repository >
โครงการพัฒนาบุคลากร (K41-TAC) >
ทุนพัฒนาบุคลากรปี 2561 >
Please use this identifier to cite or link to this item:
http://hdl.handle.net/123456789/4651
|
Title: | วิทยานิพนธ์เรื่อง การเลือกคุณลักษณะข้อมูลโดยใช้วิธีสหสัมพันธ์รูปแบบต้นไม้ |
Authors: | ประจักษ์, ยาพิลา |
Keywords: | ทุนวิจัย 2561 ทุน สทป. สหสัมพันธ์รูปแบบต้นไม้ ประจักษ์ ยาพิลา K41-00046 |
Issue Date: | 18-Oct-2023 |
Publisher: | สถาบันเทคโนโลยีป้องกันประเทศ |
Abstract: | การเรียนรู้ของเครื่อง (machine learning) เป็นวิธีการทางด้านปัญญาประดิษฐษ์ (artificial intelligence) ที่ถูกนํามาใช้ในการสร้างระบบตรวจจับสัญญาณการบุกรุกในระบบสารสนเทศ ซึ่งส่วน
ใหญ่จะใช้เทคนิคการจําแนกประเภทข้อมูล (data classification) ในการวิเคราะห์ข้อมูลภายในระบบ หรือโปรแกรมต่างๆ เพื่อระบุว่าข้อมูลจากระบบมีรูปแบบที่สอดคล้องกับการบุกรุกหรือไม่
แต่ในการจําแนกประเภทของข้อมูลขนาดใหญ่จําเป็นต้องใช้ทรัพยากรเป็นจํานวนมาก จึงมีขั้นตอนในการลดขนาดของข้อมูลก่อนนําข้อมูลที่ได้ไปเข้ากระบวนการจําแนกประเภทข้อมูล ในการลดขนาดข้อมูลที่มีความนิยมจะใช้การเลือกคุณลักษณะข้อมูล (feature selection) เพื่อลดปริมาณของคุณลักษณะข้อมูลลง ทําให้สามารถจําแนกประเภทข้อมูลได้เร็วขึ้น ในงานวิจัยนี้เสนอวิธีการเลือกคุณลักษณะข้อมูลด้วยวิธีสหสัมพันธ์รูปแบบต้นไม้ (correlation tree) โดยการสร้างโครงสร้างต้นไม้จากค่าสหสัมพันธ์ (correlation) ของข้อมูลแล้วเลือกข้อมูลสําคัญตามความสําคัญในลําดับชั้นของโครงสร้างต้นไม้ที่สร้างขึ้น จากนั้นจึงเปรียบเทียบประสิทธิภาพในการจําแนกประเภทข้อมูลของชุดข้อมูลที่ได้จากการเลือกคุณลักษณะโดยใช้วิธีสหสัมพันธ์รูปแบบต้นไม้กับการเลือกคุณลักษณะโดยวิธีอื่นๆ ซึ่งจะทดสอบโดยการใช้การจําแนกประเภทข้อมูล 3 วิธีคือ แบบต้นไม้ตัดสินใจ (decision tree)
แบบการสุ่มป่าไม้ (random forest) และแบบนาอีฟเบย์ (naïve bayes) Machine learning, an algorithm using a concept of artificial intelligence, is used
in intrusion detection systems. Data classification is a process mostly used to analyze
data in systems or programs in order to identify if the data have any correlation to
an intrusion. However, a number of resources must be consumed in order to classify
large amount of data. For this reason, there are processes used to reduce a size of
the data before using those data in a data classification process. One of the most
frequently used data reduction techniques is a feature selection technique, resulting
in a faster data classification process. In this research, correlation tree method is
applied for the feature selection method by creating correlation tree from the
correlations of data and selecting the data prioritized by the correlation tree. After
that, the efficiency of feature selection methods, correlation tree and other
techniques, will be compare by using three data classification methods, which are
decision tree, random forest and naïve bayes. |
Description: | ทุนอุดหนุนการศึกษา |
URI: | http://hdl.handle.net/123456789/4651 |
Appears in Collections: | ทุนพัฒนาบุคลากรปี 2561
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|