Bài 7: Quản trị dữ liệu

0

1. Khái niệm về cơ sở dữ liệu

Khi quản lý thông tin về một đối tượng nào đó, ví dụ như quản lý nhân viên, có rất nhiều thông tin cần quản lý liên quan đến nhân viên đó như:họ tên, giới tính, năm sinh, nơi sinh, địa chỉ, mã ngạch, bậc, hệ số, lương, phụ cấp, chức vụ,… Đó là các thuộc tính phản ánh nội dung của một đối tượng cần quản lý. Các thuộc tính đó thường được biểu diễn dưới dạng các kiểu dữ liệu khác nhau (dạng chuỗi, số, ngày tháng,…) và được hợp nhất thành một đơn vị thông tin duy nhất gọi là bản ghi (record). Các bản ghi cùng cấu trúc hợp lại thành một cơ sở dữ liêu.

Trong Calc, cơ sở dữ liệu có dạng như một danh sách, ví dụ: Danh sách sản phẩm, Danh sách thí sinh dự thi,… Mỗi danh sách có thể gồm có một hay nhiều cột, mỗi cột được gọi là một trường (field), tên của cột được gọi là tên trường.

Hàng đầu tiên trong danh sách chứa các tên trường được gọi là hàng tiêu đề, các hàng tiếp theo mỗi hàng là một bản ghi cho biết thông tin về đối tượng được quản lý.

Tên trường phải là dạng ký tự, không được dùng số, công thức, tọa độ ô… ). Nên đặt tên trường ngắn gọn, không trùng lặp.Không nên có miền rỗng trong cơ sở dữ liệu.

2. Sắp xếp dữ liệu

Calc cho phép bạn sắp xếp các hàng hoặc các cột trong vùng được chọn theo thứ tự tăng dần hoặc giảm dần của dữ liệu. Ví dụ: sắp xếp tên theo thứ tự ABC, sắp xếp năm sinh theo thứ tự tăng dần,…

  • Một số điểm lưu ý khi sắp xếp dữ liệu:

–    Khi xếp thứ tự một danh sách (cơ sở dữ liệu), phải chọn tất cả các cột (trừ cột STT nếu có) để tránh sự mất chính xác của dữ liệu.

–    Danh sách không có tên trường thì tên cột sẽ thay thế.

–    Trường quy định cách xếp thứ tự gọi là khoá. Bạn có thể dùng tối đa 3 khoá. Các bản ghi cùng giá trị ở khoá thứ nhất được xếp thứ tự theo khoá thứ hai, cùng giá trị ở khoá thứ hai được xếp thứ tự theo khoá thứ ba.

  • Cách sắp xếp dữ liệu:

–    Chọn miền dữ liệu cần sắp xếp.

–    Vào menu Data\Sort, chọn thẻ Sort Criteria42Hình 42. Hộp hội thoại Sort – Thẻ Sort Criteria

–    Chọn khoá sắp xếp.

–    Chọn sắp xếp tăng dần hoặc giảm dần cho khoá.

–    Nhấn nút <<OK>> để thực hiện sắp xếp danh sách.Nếu  muốn  sắp  xếp  theo  hàng  thì  trên  hộp  hội  thoại  Sort,  chọn  thẻ Options, sau đó tích chọn ô Left to right (sort columns).

3. Lọc dữ liệu

Lọc dữ liệu là lấy ra những bản ghi thoả mãn điều kiện nhất định từ cơ sở dữ liệu ban đầu.

3.1. Các yếu tố cơ bản

Để thực hiện lọc dữ liệu, phải xác định các yếu tố cơ bản sau trên bảng tính:

–    Miền dữ liệu (Data range): chứa toàn bộ dữ liệu  cần xử  lý, kể cả hàng tiêu đề.

–    Miền  tiêu  chuẩn  (Filter  criteria):  là  miền  bất  kỳ  trên  bảng  tính ngoài vùng cơ sở dữ liệu, chứa các tiêu chuẩn (điều kiện mà các bản ghi phải thỏa mãn). Miền tiêu chuẩn gồm tối thiểu 2 hàng: hàng đầu chứa tiêu đề của miền tiêu chuẩn. Các tiêu đề này hoặc là tên trường hoặc  là  tên  bất  kỳ  phụ  thuộc  vào  phương  pháp  thiết  lập  tiêu  chuẩn trực tiếp hay gián tiếp. Từ hàng thứ hai trở đi là tiêu chuẩn của cơ sở dữ liệu.

+   Miền  tiêu  chuẩn  so  sánh  trực  tiếp:  cho  phép  đưa  vào  các  tiêu chuẩn để so sánh dữ liệu trong một trường với một giá trị nào đó. Tiêu chuẩn so sánh trực tiếp được tạo ra theo nguyên tắc sau:

ƒ    Hàng đầu ghi tiêu đề chuẩn, lấy tên trường làm tiêu đề.

ƒ    Hàng thứ hai trở đi để ghi các tiêu chuẩn so sánh, trước các giá trị đó có thể thêm các toán tử so sánh như >, >=, <, <=.

Các tiêu chuẩn trên cùng hàng (thường gọi là điều kiện và –and) được thực hiện đồng thời. Các tiêu chuẩn trên các hàng khác nhau (thường được gọi là điều kiện hoặc là – or) được thực hiện không đồng thời.

+   Miền tiêu chuẩn so sánh gián tiếp (hay còn gọi là tiêu chuẩn công thức): cho phép đưa vào các tiêu chuẩn để so sánh dữ liệu hoặc một phần dữ liệu trong một trường với một giá trị nào đó. Tiêu chuẩn so sánh gián tiếp được tạo ra theo nguyên tắc sau:

ƒ    Hàng đầu ghi tiêu đề cho các tiêu chuẩn. Tiêu đề này có thể đặt bất kỳ nhưng không được trùng với tên trường nào.

ƒ    Từ  hàng  thứ  hai  trở  đi  ghi  các  tiêu  chuẩn  so  sánh,  mỗi  tiêu chuẩn là một công thức. Công thức này phải chứa địa chỉ của bản ghi đầu tiên. Kết quả thực hiện công thức này là một giá trị Logic: TRUE (đúng) hoặc FALSE (sai)

–    Miền đích (Copy to): miền trống trên bảng tính, dùng để chứa các bản ghi đạt tiêu chuẩn.

3.2. Lọc tự động (AutoFilter)

–    Chọn miền dữ liệu định lọc (kể cả hàng tiêu đề).

–    Vào menu Data\Filter\AutoFilter, Calc sẽ tự động chèn những mũi tên vào bên phải của các tên trường.

–    Để  lọc  theo  trường  nào,  nhấn  chuột  vào  mũi  tên  bên  phải  của  tên trường  đó,  xuất  hiện  danh  sách  các  tiêu  chuẩn  lọc  tương  ứng  của trường.43

Hình 43. Ví dụ về lọc tự động trong Calc

–    Nhấn  chọn  tiêu  chuẩn  lọc  mong  muốn,  trên  màn  hình  chỉ  còn  lại những bản ghi thoả mãn tiêu chuẩn lọc vừa chọn.

–    Để hiển thị lại tất cả các bản ghi, nhấn chuột vào mũi tên bên phải của trường đã lọc, chọn All.

–    Để bỏ chế độ lọc dữ liệu tự động, vào menu Data\Filter\AutoFilter để bỏ dấu chọn.

3.3. Lọc nâng cao (Advanced Filter)

Chức năng lọc nâng cao dùng để tìm các bản ghi thỏa mãn các điều kiện phức tạp hơn. Chức năng này ứng với các tiêu chuẩn so sánh gián tiếp, bắt buộc phải dùng miền tiêu chuẩn. Cách thao tác như sau:

–    Xây dựng miền tiêu chuẩn.

–    Chọn miền dữ liệu định lọc.

–    Vào menu Data\Filter\Advanced Filter, xuất hiện hộp hội thoại:44

Hình 44. Hộp hội thoại Advanced Filter

–    Tại khung Read filter criteria from, chọn miền tiêu chuẩn vừa xây dựng.

–    Nếu  muốn  các  bản  ghi  đạt  tiêu  chuẩn  hiển  thị  tại  miền  riêng,  tích chọn ô Copy result to và chọn miền mới tại khung bên dưới.

–    Nhấn nút <<OK>> để thực hiện lọc dữ liệu nâng cao.

4. Tổng kết theo nhóm

4.1. Tổng kết theo một loại nhóm (Subtotals):

Chức năng này cho phép tạo các dòng tổng kết trong một cơ sở dữ liệu,ví dụ: tổng kết có bao nhiêu nam, bao nhiêu nữ trong tổng số nhân viên trong danh sách. Chức năng này sẽ chèn các tính toán thống kê theo yêu cầu của bạn tại các vị trí cần thiết. Cách thực hiện như sau:

–    Chọn cơ sở dữ liệu cần tổng kết.

–    Vào menu Data\Subtotals, xuất hiện hộp hội thoại:45

Hình 45. Hộp hội thoại Subtotals

–    Chọn trường dữ liệu dùng để nhóm tại ô Group by.

–    Tích  chọn  trường  dữ  liệu  dùng  để  tổng  kết  tại  khung  Calculate subtotals for.

–    Chọn hàm dùng để tính toán tổng kết dữ liệu tại ô Use function.

–    Nhấn nút <<OK>> để thực hiện việc tổng kết theo nhóm.

Ví dụ: Danh sách nhân viên được tổng kết theo nhóm Giới tính:46

Hình 46. Ví dụ về tổng hợp danh sách theo nhóm Giới tính

Để  bỏ  tổng  kết  theo  nhóm,  nhấn  nút  <<Delete>>  trên  hộp  hội  thoại Subtotals.

4.2. Tổng kết theo nhiều loại nhóm

Chức năng này của Calc cho phép tự động hóa quá trình tổng kết theo nhiều nhóm, phân tích và đánh giá số liệu mà sau đây được gọi là: Bảng tổng hợp.

  • Bảng tổng hợp được chia làm 4 vùng:

–    Page  Field:  Toàn  bộ  dữ  liệu  được  tổng  kết  theo  từng  nhóm  của trường được  chọn.  Page  Field  luôn  nằm ở  phía  trên  của  bảng  tổng hợp.

–    Row Field: Mỗi nhóm dữ liệu của trường được chọn được tổng kết trên một dòng. Nếu số trường được chọn nhiều hơn 1, bảng tổng hợp sẽ tổng kết các trường theo thứ tự từ trên xuống dưới.

–    Column Field: Mỗi nhóm dữ liệu của trường được chọn được tổng kết trên một cột. Nếu số  trường được chọn nhiều hơn 1, bảng tổng hợp sẽ tổng kết các trường theo thứ tự từ trái sang phải.

–    Data Field: Vùng dữ liệu được sử dụng để phân tích bằng các phép toán khác nhau như Sum, Count, Average,…

  • Tạo mới một bảng tổng hợp:

–    Chọn miền dữ liệu kể cả tiêu đề của các cột.

–    Vào menu Data\DataPilot\Start, xuất hiện hộp hội thoại:47

Hình 47. Hộp hội thoại Select Source

–    Tích  chọn  Current  selection  và  nhấn  nút  <<OK>>,  xuất  hiện  hộp hội thoại:48

Hình 48. Hộp hội thoại DataPilot

–    Kéo và thả các nút tên trường tại các vùng thích hợp để phân tích dữ liệu

Nguồn: Sưu tầm

Share.

About Author

Leave A Reply