You are on page 1of 17

Tổng Quan Về Mạng Noron Nhân Tạo

I. Lịch sử phát triển


-Mạng noron nhân tạo được xây dựng từ những năm 1940 nhằm mô phỏng một
số chức năng của bộ não người. Dựa trên quan điểm cho rằng bộ não người là bộ
điều khiển. Mạng noron nhân tạo được thiết kế tương tự như noron sinh học sẽ
có khả năng giải quyết hàng loạt các bài toán.
-Quá trình nghiên cứu và phát triển noron nhân tạo có thể được chia thành 4 giai
đoạn như sau :
Giai đoạn 1: Có thể tính từ nghiên cứu của William (1890) về tâm lý học
với sự liên kết các noron thần kinh. Năm 1940 Mc Culloch và Pitts đã
cho biết noron có thể mô hình hoá như thiết bị ngưỡng (Giới hạn) để
thực hiện các phép tính logic và mô hình mạng noron của Mc Culloch -
Pitts cùng với giải thuật huấn luyện mạng của Hebb ra đời năm 1943.
Giai đoạn 2: Vào khoảng gần những năm 1960, một số mô hình noron
hoàn thiện hơn đã được đưa ra như: Mô hình Perceptron của Rosenblatt
(1958), Adalile của Widrow (1962). Trong đó mô hình Perceptron rất
được quan tâm vì nguyên lý đơn giản, nhưng nó cũng có hạn chế vì như
Marvin Minsky và Seymour papert của MIT ( Massachurehs Insritute of
Technology) đã chứng minh nó không dùng được cho các hàm logic
phức (1969). Còn Adaline là mô hình tuyến tính, tự chỉnh, được dùng
rộng rãi trong điều khiển thích nghi, tách nhiễu và phát triển cho đến
nay.
Giai đoạn 3: Có thể tính vào khoảng đầu thập niên 80. Những đóng góp
lớn cho mạng noron trong giai đoạn này phải kể đến
Grossberg,Kohonen, Rumelhart và Hopfield.Trong đó đóng góp lớn của
Hopfield gồm hai mạng phản hồi: Mạng rời rạc năm 1982 và mạng liên
tục năm 1984. Đặc biệt, ông đã dự kiến nhiều khả năng tính toán lớn của
mạng mà một nơron không có khả năng đó. Cảm nhận của Hopfield đã
được Rumelhart, Hinton và Williams đề xuất thuật toán sai số truyền
ngược nổi tiếng để huấn luyện mạng noron nhiều lớp nhằm giải bài toán
mà mạng khác không thực hiện được. Nhiều ứng dụng mạnh mẽ của
mạng noron ra đời cùng với các mạng theo kiểu máy Boltzmann và
mạng Neocognition của Fukushima.
Giai đoạn 4: Tính từ năm 1987 đến nay, hàng năm thế giới đều mở hội
nghị toàn cầu chuyên ngành nơron IJCNN (International Joit Conference
on Neural Networks). Rất nhiều công trình được nghiên cứu để ứng
dụng mạng nơron vào các lĩnh vực như: Kỹ thuật tính, điều khiển, bài
toán tối ưu, y học, sinh học, thống kê, giao thông, hoá học,...Cho đến
nay mạng nơron đã tìm và khẳng định được vị trí của mình trong rất
nhiều ứng dụng khác nhau.
-Theo nghĩa sinh học, mạng nơron là tập hợp các dây thần kinh kết nối với
nhau.Do đó thuật ngữ mạng nơron xác định hai khái niệm phân biệt:
 Mạng nơron sinh học
 Mạng nơron nhân tạo
II. Mạng nơ-ron sinh học :là một mạng lưới (plexus) các nơ-ron có kết
nối hoặc có liên quan về mặt chức năng trực thuộc hệ thần kinh ngoại biên
(peripheral nervous system) hay hệ thần kinh trung ương (central nervous
system). Trong ngành thần kinh học (neuroscience), nó thường được dùng để chỉ
một nhóm nơ-ron thuộc hệ thần kinh là đối tượng của một nghiên cứu khoa học
nhất định.
Chúng có cấu trúc và nguyên lý hoạt động chung như sau:

-Mỗi nơron sinh học gồm có 3 thành phần:Thân nơron với nhân ở bên trong
(soma), một đầu dây thần kinh ra (axon) và một hệ thống phân nhánh hình cây
(Dendrite) để nhận các thông tin vào. Trong thực tế có rất nhiều dây thần kinh
vào và chúng bao phủ một diện tích rất lớn (0,25mm2). Mỗi nơron nhận tín hiệu
vào từ các tế bào thần kinh khác. ---Chúng tích hợp các tín hiệu vào, khi tổng tín
hiệu vượt quá một ngưỡng nào đó chúng tạo tín hiệu ra và gửi tín hiệu này tới
các nơron khác thông qua dây thần kinh. Các nơron liên kết với nhau thành
mạng. Mức độ bền vững của các liên kết này xác định một hệ số gọi là trọng số
liên kết.
III.Mạng nơ-ron nhân tạo : là mạng nơ-ron là một mô hình toán học
hay mô hình tính toán được xây dựng dựa trên các mạng nơ-ron sinh học. Nó
gồm có một nhóm các nơ-ron nhân tạo (nút) nối với nhau, và xử lý thông tin
bằng cách truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận
connectionism đối với tính toán).
-Trong nhiều trường hợp, mạng nơ-ron nhân tạo là một hệ thống thích ứng
(adaptive system) tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài
hay bên trong chảy qua mạng trong quá trình học.
Sau đây là mô hình của một nơron nhân tạo

Nơron này sẽ hoạt động như sau: giả sử có N inputs, nơron sẽ có N weights
(trọng số) tương ứng với N đường truyền inputs. Nơron sẽ lấy tổng cótrọng số
của tất cả các inputs. Nói như thế có nghĩa là nơron sẽ lấy input thứ nhất, nhân
với weight trên đường input thứ nhất, lấy input thứ hai nhân với weight của
đường input thứ hai v.v..., rồi lấy tổng của tất cả các kết quả thu được. Đường
truyền nào có weight càng lớn thì tín hiệu truyền qua đó càng lớn, như vậy có
thể xem weight là đại lượng tương đương với synapse trong nơron sinh học. Có
thể viết kết quả lấy tổng của nơron như sau:
Kết quả này sẽ được so sánh với threshold t của nơron, nếu nó lớn hơn t thì
nơron cho output là 1, còn nếu nhỏ hơn thì output là 0. Ngoài ra ta cũng có thể
trừ tổng nói trên cho t, rồi so sánh kết quả thu được với 0, nếu kết quả là dương
thì nơron cho ouput bằng 1, nếu kết quả âm thì output là 0. Dưới dạng toán học
ta có thể viết output của nơron như sau:

Trong đó f là hàm Heaviside:

f được gọi là threshold function hay transfer function của nơron, còn giá trị (-t)
còn được gọi là bias hay offset của nơron.
Nếu chúng ta đưa thêm một input nữa vào, input thứ 0, có giá trị luôn luôn bằng
1 và weight luôn luôn bằng bias (-t) thì output của nơron còn có thể viết dưới
dạng:

Lưu ý là chỉ số của tổng bây giờ bắt đầu từ 0 chứ không phải bằng 1 như trước
nữa.

IV.Ứng dụng mạng noron nhân tạo


Trong quá trình phát triển, mạng nơron được ứng dụng thành công trong rất
nhiều lĩnh vực.

Dưới đây liệt kê ra một số ứng dụng chính của mạng nơron:
- Hàng không vũ trụ: Phi công tự động, giả lập đường bay, các hệ thống điều
khiển lái máy bay, bộ phát hiện lỗi.

- Ô tô: Các hệ thống dẫn đường tự động cho ô tô, các bộ phân tích hoạt động
của xe.

- Ngân hàng: Bộ đọc séc và các tài liệu, tính tiền của thẻ tín dụng.

- Quốc phòng: Định vị - phát hiện vũ khí, dò mục tiêu, phát hiện đối tượng,
nhận dạng nét mặt, các bộ cảm biến thế hệ mới, xử lý ảnh radar,...

- Điện tử: Dự đoán mã tuần tự, sơ đồ chip IC, điều khiển tiến trình, phân tích
nguyên nhân hỏng chip, nhận dạng tiếng nói, mô hình phi tuyến.

- Giải trí : Hoạt hình, các hiệu ứng đặc biệt, dự báo thị trường.
-Tài chính : Định giá bất động sản, cho vay, kiểm tra tài sản cầm cố, đánh giá
mức độ hợp tác, phân tích đường tín dụng, chương trình thương mại qua giấy tờ,
phân tích tài chính liên doanh, dự báo tỷ giá tiền tệ.

- Bảo hiểm: Đánh giá việc áp dụng chính sách, tối ưu hóa sản phẩm.
- .....

V. Cấu trúc mạng Noron nhân tạo


- Bao gồm :
 Cầu trúc mạng 1 lớp
- Mạng Hopfield
- Mạng Abam (Adaptive Bidirectional Associative Memory NNet)
- Mạng Kohonen
- Mạng Perceptron
 Cấu trúc mạng nhiều lớp (Multi-layer Perceptron)
-Ở đây chúng tôi chỉ nói đến perceptrons ( Mạng nhiều lớp
truyền thẳng )
Perceptrons là các mạng nơron mà trong mỗi nơron chỉ được liên
kết với tất cả các nơron ở lớp kế tiếp và tất cả các mối liên kết chỉ
được xây dựng từ trái sang phải.

Đầu ra của mạng được cho bởi:

Để thuận tiện cho sự xem xét các phần tử riêng lẻ của


vector đầu ra. Hãy xem xét ma trận trọng số:
Chúng tôi sẽ xác định một vector gồm các phần tử của
hàng thứ i của W:

Ma trận trọng số trở thanh:


Phần tử thứ i của vector đầu ra mạng:

Mà hàm truyền harlim được định nghĩa như sau:

Vì vậy, tích trong hàng thứ i của ma trận


trọng số với vecto đầu vào lớn hơn hoặc bằng -
bi , thi đầu ra sẽ là1, trái lại đầu ra sẽ là 0.
Vi thế mỗi neuron trong mạng chia không
gian đầu vào thành hai khu vực. Nó rất hữu ích
để điều tra cac ranh giới giữa các khu vực
này.

You might also like