Đề 10 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 10 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 10 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Số câu30
Quiz ID13235
Câu 1
1. Đường cong ROC (Receiver Operating Characteristic) và diện tích dưới đường cong AUC (Area Under the Curve) được sử dụng để đánh giá hiệu suất của mô hình nào?
Câu 2
2. Nguyên tắc hoạt động chính của thuật toán Apriori trong khai phá luật kết hợp là gì?
Câu 3
3. Mạng nơ-ron (neural network) thường được sử dụng hiệu quả nhất cho loại bài toán khai phá dữ liệu nào?
Câu 4
4. Trong khai phá dữ liệu văn bản (text mining), kỹ thuật 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?
Câu 5
5. So sánh thuật toán K-means và DBSCAN trong phân cụm. Điểm khác biệt chính là gì?
Câu 6
6. Trong bài toán hồi quy (regression), độ đo 'RMSE' (Root Mean Squared Error) thể hiện điều gì?
Câu 7
7. Trong khai phá dữ liệu, 'data warehouse' (kho dữ liệu) có vai trò gì?
Câu 8
8. Khai phá dữ liệu (Data Mining) được định nghĩa chính xác nhất là:
Câu 9
9. Ứng dụng của khai phá dữ liệu trong lĩnh vực y tế là gì?
Câu 10
10. Trong bài toán phân loại (classification), độ đo 'precision' (độ chính xác) được tính như thế nào?
Câu 11
11. Trong quy trình Khám phá tri thức từ dữ liệu (KDD), bước nào sau đây diễn ra **trước** bước Khai phá dữ liệu?
Câu 12
12. Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong đánh giá mô hình khai phá dữ liệu?
Câu 13
13. Khái niệm 'curse of dimensionality' (lời nguyền chiều dữ liệu) trong khai phá dữ liệu đề cập đến vấn đề gì?
Câu 14
14. Kỹ thuật 'feature selection' (chọn lọc đặc trưng) trong tiền xử lý dữ liệu nhằm mục đích chính gì?
Câu 15
15. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?
Câu 16
16. Ứng dụng nào sau đây **KHÔNG** phải là ứng dụng phổ biến của khai phá dữ liệu?
Câu 17
17. Nhược điểm của thuật toán K-means clustering là gì?
Câu 18
18. Phương pháp nào sau đây thuộc nhóm kỹ thuật 'clustering' (phân cụm) trong khai phá dữ liệu?
Câu 19
19. Độ đo 'support' (hỗ trợ) trong khai phá luật kết hợp (association rule mining) thể hiện điều gì?
Câu 20
20. Trong khai phá dữ liệu, 'overfitting' (quá khớp) đề cập đến vấn đề gì?
Câu 21
21. Kỹ thuật 'anomaly detection' (phát hiện bất thường) được sử dụng để làm gì trong khai phá dữ liệu?
Câu 22
22. Trong khai phá dữ liệu chuỗi thời gian (time series data mining), mục tiêu chính thường là gì?
Câu 23
23. Trong quá trình tiền xử lý dữ liệu, kỹ thuật 'normalization' (chuẩn hóa) dữ liệu nhằm mục đích gì?
Câu 24
24. Phân biệt chính giữa giữa khai phá dữ liệu và thống kê truyền thống là gì?
Câu 25
25. Vấn đề 'imbalanced dataset' (dữ liệu mất cân bằng) trong phân loại xảy ra khi nào?
Câu 26
26. Khái niệm 'ensemble learning' (học tập kết hợp) trong khai phá dữ liệu là gì?
Câu 27
27. Trong khai phá dữ liệu web (web mining), 'web usage mining' (khai phá sử dụng web) tập trung vào việc phân tích loại dữ liệu nào?
Câu 28
28. Phương pháp 'dimensionality reduction' (giảm chiều dữ liệu) như PCA (Principal Component Analysis) hoạt động dựa trên nguyên tắc nào?
Câu 29
29. Ưu điểm chính của cây quyết định (decision tree) so với các mô hình phân loại khác là gì?
Câu 30
30. Chỉ số 'F1-score' là trung bình điều hòa (harmonic mean) của hai độ đo nào trong đánh giá mô hình phân loại?

Để lại một bình luận