Đề 4 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 4 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 4 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Số câu30
Quiz ID13229
Câu 1
1. Đánh giá mô hình phân loại thường sử dụng ma trận nhầm lẫn (Confusion Matrix). Giá trị 'True Positive' (TP) trong ma trận này thể hiện điều gì?
Câu 2
2. Trong khai phá dữ liệu, 'Overfitting' (Quá khớp) xảy ra khi nào?
Câu 3
3. Xử lý dữ liệu bị thiếu (missing values) bằng cách 'Imputation' (Ước lượng giá trị) nghĩa là gì?
Câu 4
4. Thuật toán 'Apriori' được sử dụng chủ yếu trong lĩnh vực khai phá dữ liệu nào?
Câu 5
5. Độ đo 'Precision' (Độ chính xác) trong đánh giá mô hình phân loại được tính bằng công thức nào?
Câu 6
6. Khai phá dữ liệu (Data Mining) được định nghĩa chính xác nhất là:
Câu 7
7. Trong khai phá luật kết hợp, độ đo 'Support' (Độ hỗ trợ) thể hiện điều gì?
Câu 8
8. Độ đo 'Confidence' (Độ tin cậy) trong khai phá luật kết hợp được tính bằng công thức nào (với X, Y là tập mục)?
Câu 9
9. Trong quy trình Khám phá Tri thức từ Dữ liệu (KDD), bước nào diễn ra NGAY SAU bước 'Chọn dữ liệu'?
Câu 10
10. Độ đo 'Recall' (Độ phủ) trong đánh giá mô hình phân loại được tính bằng công thức nào?
Câu 11
11. Mô hình 'Neural Network' (Mạng nơ-ron) hoạt động dựa trên nguyên lý nào?
Câu 12
12. Kỹ thuật 'Feature Scaling' (Tỉ lệ hóa thuộc tính) thường được áp dụng trong tiền xử lý dữ liệu để làm gì?
Câu 13
13. Đạo đức trong khai phá dữ liệu (Data Mining ethics) tập trung vào vấn đề gì?
Câu 14
14. Phương pháp nào sau đây giúp giảm thiểu nguy cơ 'Overfitting' trong mô hình cây quyết định?
Câu 15
15. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán phân cụm?
Câu 16
16. F1-score là trung bình điều hòa của độ đo nào?
Câu 17
17. ROC curve (Đường cong ROC) thường được sử dụng để đánh giá hiệu suất của mô hình nào?
Câu 18
18. Khi nào thì việc sử dụng phương pháp 'Ensemble Learning' (Học tập hợp) trở nên đặc biệt hữu ích?
Câu 19
19. Trong khai phá dữ liệu văn bản (Text Mining), bước 'Tokenization' (Phân tách từ) có nghĩa là gì?
Câu 20
20. Phương pháp nào sau đây KHÔNG thuộc nhóm phương pháp tiền xử lý dữ liệu?
Câu 21
21. AUC (Area Under the ROC Curve) thể hiện điều gì?
Câu 22
22. Phương pháp 'Decision Tree' (Cây quyết định) thuộc nhóm kỹ thuật khai phá dữ liệu nào?
Câu 23
23. Đâu là nhược điểm chính của thuật toán K-means?
Câu 24
24. Thách thức lớn nhất khi khai phá dữ liệu trên dữ liệu lớn (Big Data) thường là gì?
Câu 25
25. Trong bối cảnh dữ liệu lớn, phương pháp nào sau đây thường được ưu tiên để giảm chiều dữ liệu?
Câu 26
26. Trong khai phá dữ liệu chuỗi thời gian (Time Series Data Mining), mục tiêu chính thường là gì?
Câu 27
27. Phương pháp khai phá dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm tương tự?
Câu 28
28. Phương pháp 'Anomaly Detection' (Phát hiện bất thường) được sử dụng để làm gì?
Câu 29
29. TF-IDF (Term Frequency-Inverse Document Frequency) là một kỹ thuật được sử dụng trong khai phá dữ liệu văn bản để làm gì?
Câu 30
30. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khai phá dữ liệu?

Để lại một bình luận