Trong quá trình xử lý bảng tính, đặc biệt là khi tổng hợp báo cáo từ nhiều nguồn khác nhau, việc xuất hiện các dòng thông tin lặp lại là điều không thể tránh khỏi. Nếu không nắm vững cách lọc dữ liệu trùng trong Excel, bạn sẽ dễ dàng rơi vào tình trạng sai lệch số liệu, gây ảnh hưởng nghiêm trọng đến kết quả phân tích cuối cùng. Việc dọn dẹp dữ liệu (Data Cleaning) là bước đầu tiên và quan trọng nhất đối với bất kỳ ai làm việc với dữ liệu. May mắn thay, Microsoft Excel cung cấp cho chúng ta rất nhiều công cụ mạnh mẽ để giải quyết vấn đề này. Từ những tính năng “mì ăn liền” như Remove Duplicates đến các hàm chuyên sâu, bài viết này sẽ giúp bạn thực hiện mọi thao tác một cách chính xác nhất.
Vì sao cần lọc dữ liệu trùng trong Excel?
Sở dĩ việc tìm hiểu cách lọc dữ liệu trùng trong Excel trở thành kỹ năng “sống còn” của dân văn phòng là bởi tính toàn vẹn của thông tin. Dữ liệu trùng lặp không chỉ làm tăng dung lượng file một cách vô ích mà còn trực tiếp làm sai lệch các phép tính tổng (SUM), trung bình (AVERAGE) hay các hàm đếm (COUNT). Hãy tưởng tượng bạn đang quản lý danh sách 1.000 khách hàng, nhưng trong đó có 200 người bị lặp lại do lỗi nhập liệu; nếu không lọc trùng, ngân sách quà tặng hoặc chiến dịch marketing của bạn sẽ bị lãng phí đáng kể.

Bên cạnh đó, một bảng dữ liệu sạch sẽ giúp việc quản lý và truy xuất thông tin trở nên nhanh chóng hơn. Khi dữ liệu được tinh lọc, các công cụ như VLOOKUP hay Pivot Table sẽ hoạt động ổn định và trả về kết quả chính xác 100%. Chính vì vậy, biết cách lọc dữ liệu trùng trong Excel chính là cách bạn nâng cao uy tín trong công việc thông qua những báo cáo chất lượng và tin cậy.
Cách lọc dữ liệu trùng trong Excel bằng Remove Duplicates
Tính năng Remove Duplicates là công cụ trực tiếp nhất mà Microsoft trang bị cho Excel để người dùng loại bỏ các dòng có nội dung giống nhau. Đây là phương pháp “xóa vĩnh viễn”, vì vậy bạn nên cân nhắc kỹ trước khi thực hiện.
Bước 1: Bạn hãy dùng chuột bôi đen toàn bộ vùng bảng tính có chứa các giá trị trùng lặp. Lưu ý nên bao gồm cả phần tiêu đề (Header) để Excel dễ dàng phân loại các cột. Nếu muốn nhanh hơn, bạn có thể click vào một ô bất kỳ trong bảng và nhấn tổ hợp phím Ctrl + A.

Bước 2: Trên thanh Ribbon phía trên màn hình, bạn tìm và nhấn vào thẻ Data. Sau đó, tại nhóm công cụ Data Tools, bạn nhấn chọn biểu tượng Remove Duplicates.

Bước 3: Hãy tích vào ô My data has headers nếu vùng chọn của bạn có bao gồm dòng tiêu đề. Trong phần Columns, bạn tích chọn các cột muốn dùng làm căn cứ để xác định trùng lặp. Nếu bạn muốn xóa dòng khi toàn bộ các thông tin trên dòng đó đều giống hệt nhau, hãy chọn Select All. Nếu bạn chỉ muốn lọc trùng dựa trên một cột nhất định (ví dụ: MSSV), hãy chỉ tích chọn cột đó.

Bước 4: Nhấn nút OK.

Cách đánh dấu dữ liệu trùng bằng Conditional Formatting
Khác với việc xóa trực tiếp, Conditional Formatting (Định dạng có điều kiện) giúp các giá trị lặp lại trở nên nổi bật hơn bằng cách tô màu. Điều này giúp bạn kiểm soát dữ liệu trực quan và tránh những sai sót đáng tiếc do xóa nhầm.
Bước 1: Bạn dùng chuột bôi đen dải ô hoặc các cột mà bạn nghi ngờ có chứa dữ liệu trùng lặp. Bạn có thể chọn một cột đơn lẻ (như cột ID) hoặc chọn toàn bộ bảng tính để Excel thực hiện quét trên phạm vi rộng hơn.

Bước 2: Trên thanh Ribbon của Excel, bạn hãy nhấn vào thẻ Home. Tại nhóm công cụ Styles, bạn tìm và chọn mục Conditional Formatting.
Bước 3: Từ menu thả xuống, bạn di chuyển chuột đến dòng đầu tiên là Highlight Cells Rules, sau đó chọn tiếp mục Duplicate Values… ở cuối danh sách hiện ra.

Bước 4: Một hộp thoại nhỏ sẽ xuất hiện. Tại ô bên trái, hãy đảm bảo tùy chọn đang là Duplicate. Ở ô bên phải (Values with), bạn có thể chọn các bảng màu có sẵn như Light Red Fill with Dark Red Text (Nền đỏ chữ đỏ đậm) hoặc chọn Custom Format để tự tạo màu sắc theo ý thích cá nhân.
Bước 5: Nhấn OK để áp dụng.
Bước 6: Cách xóa đánh dấu (nếu cần). Sau khi đã xử lý xong và muốn bảng tính quay về trạng thái ban đầu, bạn chỉ cần vào lại Conditional Formatting > chọn Clear Rules > chọn Clear Rules from Selected Cells để gỡ bỏ lớp màu đánh dấu.

Cách lọc dữ liệu trùng trong Excel bằng Advanced Filter
Khác với Remove Duplicates, Advanced Filter hoạt động như một bộ lọc thông minh, cho phép bạn sao chép các giá trị duy nhất (Unique records) sang một vùng mới.
Bước 1: Bạn click chọn vùng bảng tính cần lọc trùng. Đảm bảo rằng vùng dữ liệu của bạn có tiêu đề cột rõ ràng để Excel có thể nhận diện chính xác.

Bước 2: Trên thanh công cụ, bạn chọn thẻ Data. Tại nhóm Sort & Filter, thay vì chọn biểu tượng Filter thông thường, bạn hãy nhấn vào mục Advanced.

Bước 3: Lúc này hộp thoại Advanced Filter sẽ hiện ra, bạn cần lựa chọn một trong hai chế độ tại mục Action:
- Filter the list, in-place: Lọc và ẩn các dòng trùng ngay tại bảng hiện tại (dữ liệu trùng chỉ bị ẩn đi, không bị xóa).
- Copy to another location: Trích xuất các dòng không trùng sang một vị trí mới (Khuyên dùng để giữ an toàn dữ liệu).

Bước 4:
- Tại mục List range: Excel đã tự động điền vùng bạn chọn ở Bước 1.
- Tại mục Copy to: Bạn nhấn vào biểu tượng mũi tên và click chọn một ô trống trên bảng tính (nơi bạn muốn danh sách kết quả hiện ra).

Bước 5: Đây là bước quan trọng nhất. Bạn phải tích vào ô Unique records only ở góc dưới cùng của hộp thoại. Nếu thiếu dấu tích này, Excel sẽ chỉ thực hiện lệnh copy thông thường mà không lọc bỏ các dòng trùng.

Bước 6: Nhấn OK.

Cách lọc dữ liệu trùng trong Excel bằng Pivot Table
Pivot Table không chỉ là công cụ báo cáo mạnh mẽ mà còn là bộ lọc thông minh giúp “nhóm” các giá trị giống hệt nhau thành một đại diện duy nhất. Phương pháp này đặc biệt an toàn vì nó không tác động hay xóa bất kỳ dòng nào trên dữ liệu gốc của bạn.
Bước 1: Bạn bôi đen toàn bộ vùng dữ liệu cần lọc trùng (bao gồm cả tiêu đề cột). Tiếp theo, di chuyển chuột lên thanh Ribbon, chọn thẻ Insert và nhấn vào biểu tượng PivotTable.

Bước 2: Một hộp thoại sẽ hiện ra hỏi bạn muốn đặt kết quả ở đâu. Bạn có thể chọn New Worksheet (trang tính mới) hoặc Existing Worksheet (vị trí cụ thể trên trang hiện tại). Sau đó nhấn OK.

Bước 3: Lúc này, ở phía bên phải màn hình sẽ xuất hiện bảng PivotTable Fields. Bạn tìm tên cột muốn lọc dữ liệu trùng, sau đó dùng chuột nhấn giữ và kéo trường đó thả vào ô Rows.

Bước 4: Nếu bạn muốn biết mỗi giá trị đã xuất hiện bao nhiêu lần trong bảng gốc, hãy kéo chính trường dữ liệu đó một lần nữa và thả vào ô Values. Excel sẽ đếm (Count) số lần lặp lại của từng mục.

Bước 5: Nếu bạn muốn sử dụng danh sách này cho mục đích khác, hãy bôi đen vùng kết quả, nhấn Ctrl + C và Paste Values ra một vị trí mới để có được danh sách văn bản thuần túy đã được lọc sạch.
Cách lọc dữ liệu trùng trong Excel bằng công thức
Với các phiên bản Excel mới (Office 365), Microsoft đã cung cấp hàm UNIQUE – cách lọc dữ liệu trùng hiện đại và “lười biếng” nhất.
Cú pháp: $ =UNIQUE(vùng_dữ_liệu) $
Chỉ với một công thức duy nhất, Excel sẽ tự động trả về một mảng dữ liệu đã được lọc sạch. Nếu bạn dùng phiên bản Excel cũ, bạn có thể kết hợp các hàm phức tạp hơn như COUNTIF để xác định dòng trùng: $ =COUNTIF($A$2:A2, A2) $. Nếu kết quả lớn hơn 1, dòng đó là dòng trùng.
So sánh các cách lọc dữ liệu trùng trong Excel
| Phương pháp | Ưu điểm | Nhược điểm | Phù hợp cho |
| Remove Duplicates | Nhanh, dễ dùng, xóa triệt để. | Xóa mất dữ liệu gốc. | Dọn dẹp dữ liệu nhanh. |
| Conditional Formatting | Dễ quan sát, không mất dữ liệu. | Phải xóa thủ công sau đó. | Kiểm tra, rà soát lỗi. |
| Advanced Filter | Giữ nguyên gốc, trích xuất sang vị trí mới. | Thao tác hơi phức tạp. | Tạo danh mục duy nhất. |
| Hàm UNIQUE | Tự động cập nhật, cực nhanh. | Chỉ có trên Office 365. | Báo cáo động, linh hoạt. |
Lỗi thường gặp và cách khắc phục
Dù bạn áp dụng cách lọc dữ liệu trùng trong Excel nào đi chăng nữa, kết quả đôi khi vẫn không chính xác do những “hạt sạn” trong dữ liệu thô. Dưới đây là cách xử lý hai lỗi kinh điển nhất:
Lỗi do khoảng trắng dư thừa (Space) và ký tự không hiển thị
Đây là nguyên nhân hàng đầu khiến các công cụ như Remove Duplicates hay hàm UNIQUE “bó tay”. Trong mắt người dùng, hai ô chứa chữ “Hoàng Hà” nhìn hoàn toàn giống nhau, nhưng nếu một ô chứa khoảng trắng ở cuối (ví dụ: “Hoàng Hà “) hoặc khoảng trắng kép ở giữa, Excel sẽ định nghĩa chúng là hai giá trị riêng biệt. Lỗi này thường phát sinh khi bạn copy dữ liệu từ website, phần mềm kế toán hoặc do thói quen nhấn phím cách vô tội vạ của người nhập liệu.

Để khắc phục triệt để, bạn không nên lọc trùng ngay mà hãy tạo một cột phụ và sử dụng hàm TRIM. Hàm này sẽ giúp loại bỏ toàn bộ khoảng trắng thừa ở đầu, cuối và đưa các khoảng trắng giữa về dạng đơn. Sau đó, hãy copy kết quả từ hàm TRIM và dán dưới dạng giá trị (Paste Values) đè lên cột cũ. Khi dữ liệu đã được “chuẩn hóa” về mặt hiển thị, các cách lọc dữ liệu trùng trong Excel sẽ hoạt động chính xác 100%, đảm bảo không bỏ sót bất kỳ dòng lặp lại nào.
Lỗi do định dạng dữ liệu không đồng nhất (Data Type)
Lỗi này thường xảy ra ở các cột chứa số điện thoại, mã định danh hoặc ngày tháng. Một tình huống rất hay gặp là số “0912345678” ở dòng này được định dạng là Text (có dấu nháy đơn phía trước), nhưng ở dòng khác lại là dạng Number hoặc General. Mặc dù nội dung số giống hệt nhau, nhưng thuật toán của Excel sẽ phân loại chúng vào hai nhóm kiểu dữ liệu khác nhau, dẫn đến việc công cụ lọc trùng bỏ qua chúng. Tương tự với định dạng ngày tháng, việc một ô là “24/01/2026” dạng ngày và ô kia là chuỗi văn bản sẽ khiến bảng tính của bạn trở nên lộn xộn.

Cách khắc phục tốt nhất là bạn hãy bôi đen toàn bộ cột dữ liệu, sử dụng tính năng Text to Columns trong thẻ Data để ép tất cả về cùng một định dạng nhất định, hoặc chọn định dạng chung trong hộp thoại Format Cells. Khi tất cả các ô đã “cùng hệ quy chiếu”, việc áp dụng cách lọc dữ liệu trùng trong Excel sẽ giúp bạn loại bỏ hoàn toàn các dòng thừa, mang lại một bảng tính sạch sẽ và tin cậy để làm báo cáo.
Tạm kết
Việc thành thạo các cách lọc dữ liệu trùng trong Excel không chỉ giúp bạn làm sạch bảng tính mà còn khẳng định sự chuyên nghiệp trong cách xử lý số liệu. Tùy vào mục đích là xóa bỏ hoàn toàn hay chỉ muốn đánh dấu, hãy chọn cho mình công cụ phù hợp nhất. Nếu bạn đang tìm kiếm một chiếc laptop văn phòng mạnh mẽ để xử lý mượt mà những file Excel hàng triệu dòng, hãy ghé ngay Hoàng Hà Mobile để được tư vấn các dòng máy mới nhất với mức giá cực kỳ ưu đãi nhé!
XEM THÊM:
- 7 cách tìm kiếm trong Excel và thay thế với Find và Replace
- Hàm MID trong Excel: Cú pháp và cách sử dụng kèm ví dụ minh họa chi tiết
Nguồn Trang : https://hoanghamobile.com/tin-tuc/cach-loc-du-lieu-trung-trong-excel/
Bài viết gợi ý
- Trị thâm mụn thế nào cho hiệu quả và an toàn? Góc nhìn từ chuyên gia thẩm mỹ
Thâm mụn là tình trạng phổ biến sau mụn viêm, mụn nặng và có thể kéo dài nhiều tháng, thậm chí nhiều năm nếu không được xử lý đúng cách. Dù không gây nguy hiểm, thâm mụn l...
- Máy lạnh bị chảy nước phải làm sao? Nguyên nhân và cách xử lý nhanh gọn
- VPBank lập kỷ lục lợi nhuận 30.600 tỷ đồng năm 2025, tăng trưởng 53%
- NHẠC TREND TIKTOK REMIX 2025 | NONSTOP VIỆT MIX 2026 BASS CỰC MẠNH | NHẠC TRẺ REMIX HAY NHẤT 2026
- VinFast tăng vốn thêm 30.000 tỷ lên gần 81.000 tỷ, lớn hơn cả Vingroup
- Hình iPhone 15 đẹp: Tổng hợp hình nền 4K cho iP 15, Plus, Pro, Pro Max
- Ngang nhiên chiếm nhà người khác suốt nhiều năm: 5 lần Công an vận động vẫn nhất quyết không trả
- Nền tảng hợp đồng lao động điện tử được thiết kế kiến trúc phù hợp với điều gì?

















