Đề 6 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 6 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 6 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Số câu30
Quiz ID13231
Câu 1
1. Vấn đề 'quá khớp' (overfitting) trong khai phá dữ liệu xảy ra khi nào?
Câu 2
2. Khi nào thì phương pháp 'học tăng cường' (Reinforcement learning) được áp dụng trong khai phá dữ liệu?
Câu 3
3. Kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) được sử dụng để làm gì trong khai phá dữ liệu?
Câu 4
4. Phương pháp 'PCA' (Principal Component Analysis) là một kỹ thuật giảm chiều dữ liệu dựa trên nguyên tắc nào?
Câu 5
5. Để đánh giá hiệu suất của mô hình phân cụm, độ đo nào sau đây thường được sử dụng?
Câu 6
6. Ứng dụng của khai phá dữ liệu trong lĩnh vực y tế có thể bao gồm:
Câu 7
7. Thuật toán k-Means thường được sử dụng cho bài toán nào trong khai phá dữ liệu?
Câu 8
8. So sánh giữa phân loại (classification) và hồi quy (regression), điểm khác biệt chính là gì?
Câu 9
9. Khái niệm 'độ hỗ trợ' (support) trong khai thác luật kết hợp đo lường điều gì?
Câu 10
10. Để xử lý dữ liệu bị thiếu (missing values) trong khai phá dữ liệu, phương pháp 'điền giá trị trung bình' (mean imputation) có thể gây ra vấn đề gì?
Câu 11
11. Trong quy trình khai phá dữ liệu, giai đoạn nào thường diễn ra ĐẦU TIÊN?
Câu 12
12. Trong bài toán phân loại, 'ma trận nhầm lẫn' (confusion matrix) cung cấp thông tin gì?
Câu 13
13. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật khai phá dữ liệu phổ biến?
Câu 14
14. Một trong những thách thức đạo đức quan trọng nhất trong khai phá dữ liệu là gì?
Câu 15
15. Khi nào thì việc sử dụng 'mạng nơ-ron sâu' (Deep Neural Networks) trở nên đặc biệt hiệu quả trong khai phá dữ liệu?
Câu 16
16. Phương pháp 'rừng ngẫu nhiên' (Random Forest) thuộc loại thuật toán học máy nào?
Câu 17
17. Trong khai phá dữ liệu chuỗi thời gian, kỹ thuật nào thường được sử dụng để phát hiện các mẫu bất thường hoặc đột biến?
Câu 18
18. Mục tiêu chính của khai phá dữ liệu (Data Mining) là gì?
Câu 19
19. Trong khai thác luật kết hợp, độ đo 'lift' (độ nâng) cho biết điều gì?
Câu 20
20. Điều gì xảy ra nếu chúng ta áp dụng thuật toán k-Means với giá trị 'k' quá lớn so với số cụm thực tế trong dữ liệu?
Câu 21
21. Trong khai phá dữ liệu, 'tính giải thích được' (interpretability) của mô hình là gì và tại sao nó quan trọng?
Câu 22
22. Độ đo 'độ chính xác' (accuracy) thường được sử dụng để đánh giá hiệu suất của mô hình khai phá dữ liệu nào?
Câu 23
23. Trong khai phá dữ liệu văn bản, kỹ thuật 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?
Câu 24
24. Phương pháp nào sau đây giúp giảm thiểu vấn đề 'thiên vị' (bias) trong mô hình khai phá dữ liệu?
Câu 25
25. Trong khai phá dữ liệu, kỹ thuật nào thường được sử dụng để dự đoán một giá trị số liên tục?
Câu 26
26. Mục đích chính của việc 'làm sạch dữ liệu' (data cleaning) trong khai phá dữ liệu là gì?
Câu 27
27. Kỹ thuật 'phân cụm' (clustering) trong khai phá dữ liệu thuộc loại học máy nào?
Câu 28
28. Khi dữ liệu huấn luyện cho bài toán phân loại bị 'mất cân bằng' (imbalanced dataset), tức là một lớp chiếm tỷ lệ rất nhỏ so với các lớp khác, điều này có thể dẫn đến vấn đề gì?
Câu 29
29. Trong ngữ cảnh khai phá dữ liệu lớn (Big Data), thách thức lớn nhất thường gặp là gì?
Câu 30
30. So sánh ưu điểm và nhược điểm của cây quyết định (Decision Tree) so với mạng nơ-ron (Neural Network). Ưu điểm nổi bật của cây quyết định là gì?

Để lại một bình luận