tại sao các thông tin rời rạc lại có thể liên quan với nhau chúng ta phải suy nghĩ lại 1 tí về mối quan hệ giữa các thực thể
-cơ sở(nền móng của) dữ liệu và các hệ thống cơ sở dữ liệu trở thành 1 phần quan trong cuộc sống của chúng ta ngày nay  vd: giao dịch ngân hàng

giao dịch ngân hàng







đó là các ứng dụng cơ sở dữ liệu truyền thống, mà hầu hết dữ liệu được lưu dưới dạng kí tự hoặc số, sau này nhờ sự phát triển đã hướng tới 1 loại ứng dụng mới cho hệ thống cơ sở dữ liệu đa phương tiện(multimedia databases) có thể lưu trữ hình ảnh video và âm thanh dùng để lưu trữ và phân tích bản đồ, dự báo thời tiết và các hiện tượng vệ tinh
multimedia databases
kỹ thuật CSDL active và thời gian thực(real time và active databases technology) được sử dụng trong lĩnh vực quản lý công nghiệp và xử lý nhà máy
các kỹ thuật nghiên cứu cơ sở dữ liệu được ứng dụng web hoặc ứng dụng winform để người dùng khai thác, tìm kiếm thông tin cần thiết thông qua các chương trình ứng dụng


- nền tảng các ứng dụng cơ sở dữ liệu truyền thống
dữ liệu: dữ liệu là toàn bộ những gì được máy tính lưu trữ và xử lý dữ liệu có thể là các ký tự các con số hình ảnh hay âm thanh

+dữ liêu được chia thành 2 loại
dữ liệu tĩnh: tên, địa chỉ số điện thoại 01312496911
 dữ liệu động:báo cáo doanh thu đăng ký học phần
thông tin là phản ánh tri thức hiểu biết của con người về 1 đối tượng vd ngành mình đang học(công nghệ thông tin)
phân biệt về dữ liệu và thông tin: dữ liệu như nguyên liệu được dùng trong sản xuất sản phẩm còn thông tin như là sản phẩm, vậy dữ liệu là sản phẩm rộng thô rời rạc còn thông tin như là sản phẩm của quá trình kết xuất từ dữ liệu, tóm lại thông tin và nội dung của dữ liệu sau khi dữ lý
các dữ liệu được bao bọc trong cơ sở dữ liệu và nó có các mối liên hệ chặt chẽ với nhau
cơ sở dữ liệu phải rõ ràng và đáp ứng các yêu cầu sau
cơ sở dữ liệu phải biễu diễn 1 phần của thế giới thực, thách thức đặt ra khi xây dựng cơ sở dữ liệu là phải phản ánh được cơ sở dữ liệu này
-hệ quản trị cơ sở dữ liệu là  các chương trình cho phép người dùng và tạo ra cơ sở dữ liệu , cho phép người dùng sử dụng xây dựng và định nghĩa cơ sở dữ liệu giữa những người dùng khác nhau và ứng dụng.
hệ quản trị gồm các chương trình là cầu nối giữa người dùng với cơ sở dữ liệu
HQT CSDL cung cấp 1 giao diện giữa người dùng và dữ liệu một số hệ quản trị cơ sở dữ liệu phổ biến như:microsoft access, microsoft SQL server, Oracle, DB2...
-định nghĩa hệ cơ sở dữ liệu là sự tích hợp giữa cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu

quá trình phát triển hệ cơ sở dữ liệu
tiếp cận theo tập tin
-trước đây người ta thường sử dụng hệ thống tập tin để quản lý dữ liệu, mỗi loại người dùng định nghĩa và xử lý các tập tin bằng 1 phần mềm và ứng dụng cụ thể
-tập tin dễ bị trùng lặp và dư thừa
-dữ liệu thì dễ bị thiếu nhất quán
-chia sẽ dữ liệu bị hạn chế
-truy xuất khó khăn
-khó khôi phục khi có sự cố
1 số đặc trưng của hướng tiếp cận CSDL
-tính tự mô tả








tính độc lập, tính trừu tượng tính nhất quán,đa khung nhìn
-mức trong(lược đồ trong): mô tả cấu trúc vật lý dữ liệu
-mức quan niệm(lược đồ quan niệm):mô tả cấu trúc của toàn thể cơ sở dữ liệu cho toàn bộ cộng đồng người sử dụng, lược đồ ở mức này che bớt các chi tiết của cấu trúc lưu trữ vật lý
-mức ngoài : mức khung nhìn(mức người dùng)
mô hình dữ liệu là 1 tập các khái niệm để mô tả cấu trúc của CSDL cũng như các ràng buộc trên CSDL đó
-
mô hình= cấu trúc + ràng buộc của CSDL
-mô hình thực thể kết hợp(hình ảnh bên trên)
-mô hình quan hệ:
- mô hình hướng đối tượng
-mô hình mạng
-mô hình phân cấp

mô hình thực thể kết hợp

-mô hình(để thể hiện ngữ) dữ liệu cấp cao: dùng để thể hiện ngữ nghĩa của dữ liệu, trong chương trình này tôi sẽ trình bày 1 loại mô hình quan niệm dữ liệu đó là mô hình thực thể kết hợp
-mô hình thực thể kết hợp về cơ bản chỉ có khái niệm tập thực thể, mối kết hợp và thuộc tính về sau người ta bổ sung thêm thuộc tính kết hợp, thuộc tính suy diễn, thuộc tính đa trị, mối kết hợp tổng quát hóa chuyên biệt hóa làm cho quá trình mô hình hóa trở nên dễ dàng hơn hình thành mô hình hóa kết hợp mở rộng
-1 mô hình thực thể kết hợp thường được biểu diễn bằng sơ đồ và được gọi là sơ đồ ERD(entity relationship diagram) để biễu diễn các khái niệm trong sơ đồ này
-thực thể và tập thực thể
+thực thể(entity) là 1 đối tượng ngoài thế giới thực có thể cụ thể hoặc trừu tượng, tập thực thể là 1 tập hợp các thực thể  có tính chất giống nhau, ký hiệu của tập thực thể là hình chữ nhật
tập thực thể như GIÁO VIÊN, KHOA, BỘ MÔN
thuộc tính:
là tập hợp các đặc trưng mô tả cho tập thực thể hay mối kết hợp kí hiệu của thuộc tính là 1 hình elip bên trong và tên của thuộc tính phải là danh từ hoặc cụm danh từ, các thuộc tính phải được gắn vào thực thể bằng 1 cung vô hướng
- có nhiều loại thuộc tính như thuộc tính đơn thuộc tính kết hợp, thuộc tính đơn trị và thuộc tính suy diễn
-mối kết hợp và tập hợp mối kết hợp: mối kết hợp là tập hợp giữa 2 hay nhiều thực thể, tập hợp các mối kết hợp tương tự nhau  được gọi là tập mối kết hợp
-khóa của tập thực thể: 1 ràng buộc quan trọng giữa các thực thể trong 1 tập thực thể không có hai thực thể nào giống nhau hoàn toàn
khóa chỉ định rõ các thực thể phân biệt với nhau: khóa là tập ít nhất các thuộc tính giúp ta xác định 1 thực thể trong tập hợp thực thể, khóa cũng giúp ta xác định mối kết hợp là duy nhất trong 1 tập mối kết hợp
tập thực thể mà không chứa khóa được gọi là tập thực thể yếu( tập thực thể mà tập thuộc tính của nó có chứa khóa như ta đã biết được gọi là tập thực thể mạnh) tập thực thể yếu thường có mối kết hợp với tập thực thể chủ (còn được gọi là tập thực thể xác định) thông qua tập kết hợp xác định, tập thực thể yếu luôn tham gia toàn phần vào tập mối thực thể xác định, nhờ đó ta có thể xác định 1 tập thực thể yếu dựa vào thực thể chủ, mà nó có mối quan hệ, tập thực thể có khóa riêng phần là tập hợp ít nhất các thuộc tính của tập thực thể yếu để xác định duy nhất 1 thực thể yếu cùng có mối kết hợp với thực thể chủ, tập thuộc tính tham gia làm khóa riêng phần
mô hình dữ liệu quan hệ được Edgar Frank Codd đề xuất vào năm 1970 do tính chất đơn giản và được xây dựng trên nền tảng toán học vững chắc nên mô hình quan hệ được sử dụng rộng rãi từ thập niên 80 đến nay
 hiện tại có nhiều hệ thống thương mại sử dụng mô hình quan hệ: DB2 của IBM, Orecle của Oracle, SQL server và Acess của mcirosoft.
2. mô hình dữ liệu quan hệ
1. định nghĩa quan hệ
cho lược đồ quan hệ(relation scheme) R(A1, A2.. An) trong đó R được gọi là tên của lược đồ quan hệ và trong ngoặc là các thuộc tính của lược đồ quan hệ
1 quan hệ relation r của lược đồ quan hệ R  kí hiệu là r(R), là tập hợp các bộ ti{t1, t2... tm} mỗi bộ t là danh sách cóc chứa n giá trị vj(1
1 quan hệ thực ra là 1 bảng dữ liệu 2 chiều được đặt tên, có 1 số cột và 1 số dòng dữ liệu.
ta dùng khái niệm lược đồ quan hệ để đề cập đến cấu trúc của quan hệ