Subversion (SVN) Lê Đình Duy

1. Tại sao cần Subversion Tôi hiện có một chương trình face detector cho phép detect faces trong images (chuyện này OpenCV cũng làm được), và cho phép detect eyes trong detected faces (OpenCV ko có chức năng này). Chương trình này tôi viết từ hồi học PhD và sử dụng khá hiệu quả cho nhiều ứng dụng khác nhau. Tuy nhiên, do chương trình vẫn có một số bugs nên sau vài lần sửa, mỗi lần lưu một nơi khác nhau mà ko có chú thích gì; hậu quả là cho đến giờ, ngồi nhìn 5 copies của chương trình này, tôi ko biết ct nào là phiên bản cuối cùng ko còn bug nữa. Đây là một ví dụ trong số rất nhiều ví dụ của tôi liên quan đến quản lí các phiên bản của chương trình trong quá trình lập trình. Cách làm thông thường là mỗi phiên bản lưu thành 1 thư mục. Sau đó, mỗi khi có project mới thì lại copy thư mục này sang thư mục của project mới, đồng thời vẫn giữ lại thư mục cũ để phòng khi có thể quay lại phiên bản cũ, nếu các cập nhật trong project mới bị lỗi. Làm tới, làm lui vài lần, cuối cùng ko biết mình sửa cái gì, ở đâu, khi nào. Đó cũng chính là lí do tôi cần có một cách quản lí hiệu quả hơn về các sự thay đổi trong quá trình tiến hóa của các code tôi viết. Các version control systems như subversion (svn) chính là giải pháp mà tôi cần tìm.

Version control is the art of managing changes to information. It has long been a critical tool for programmers, who typically spend their time making small changes to software and then undoing or checking some of those changes the next day. Imagine a team of such developers working concurrently - and perhaps even simultaneously on the very same files! - and you can see why a good system is needed to manage the potential chaos.

Có khá nhiều hệ thống hỗ trợ version control, ví dụ như cvs, subversion, git, etc. Ban đầu tôi chỉ biết cvs, nhưng sau đó mới biết thêm subversion, git. Sau khi tìm hiểu, tôi quyết định chọn subversion bởi vì subversion là "hậu duệ" của cvs, ra đời để khắc phục những hạn chế của cvs (hạn chế gì của cvs mà subversion có thể giải quyết, tôi chỉ mới nghe nói, ko hiểu gì vì chưa xài cvs và so sánh nó với subversion bao giờ!). Hiện nay subversion được sử dụng khá thông dụng trong rất nhiều dự án mã nguồn mở. Git mới ra đời gần đây, viết bởi tác giả của Linux. Trong bài nói chuyện của mình ở Google Talk, Linus chỉ trích subversion là sai về nguyên tắc cơ bản. Ý chính ở đây theo tôi hiểu đó là cách quản lí. Git của Linux dùng cơ chế phân tán (distributed), trong khi cvs và subversion dùng cơ chế tập trung (client/server). Tôi thì thích kiểu client/server hơn nên đã chọn subversion.

Ví dụ foo.2. P2 sẽ checkout để lấy 1 phiên bản copy các file của project A này về máy cục bộ của mình (gọi là working copies).c-rev2 là 2 revision của tập tin foo. Để quản lí các phiên bản khác nhau.Mô hình client/server Một kịch bản thường thấy là các tập tin của project A được lưu ở repository. Subversion cung cấp các công cụ để nhận biết sự thay đổi của các tập tin ở working copies so với repository. toàn bộ repository sẽ có một con số revision mới (mỗi con số này là duy nhất và số của revision sau lớn hơn số của revision trước). Working Copies đặt ở client là các phiên bản làm việc của các tập tin trong repository. Sau đó. Một số khái niệm Subversion dựa trên mô hình quản lí tập trung kiểu client/server. Repository thì chỉ có một. Trường hợp P1 và P2 cùng cập nhật một tập tin. và thao tác này gọi là merge . Cứ mỗi lần commit. Hình 1 . Do đó.c-rev2 phải có nội dung khác nhau. đây là vấn đề phức tạp nhất. anh ta sẽ dùng lệnh update. mỗi tập tin sẽ có dạng Name-Revision. đồng thời cũng cung cấp công cụ để giúp việc merge được dễ dàng. nhưng toàn bộ các tập tin của repository sẽ có cùng một con số revision.c-rev1 và foo. dù chỉ thay đổi một tập tin sau lệnh commit. mỗi thành viên của project A. để hệ thống có thể quản lí được sự thay đổi của các tập tin. ko nhất thiết là foo. Mô hình này có 2 khái niệm cơ bản: Repository đặt ở server là nơi tập trung quản lí các phiên bản của các tập tin.c-rev1 và foo. Một điểm cần lưu ý là trong subversion. ví dụ P1. Nói một cách đơn giản. Mỗi khi P1 muốn các thay đổi trên các tập tin của project A ở máy cục bộ của mình cập nhật lên repository. subversion dùng khái niệm revision. . trong khi working copies có thể có nhiều (tương ứng với repository đó).c. anh ta sẽ dùng lệnh commit. Nếu P2 muốn thấy những thay đổi của P1 trên repository cập nhật xuống phiên bản đang dùng của mình.

ví dụ như Apache HTTP server. để thực hiện các yêu cầu tương ứng với phần mềm server (request). Trong mô hình này. sửa. người ta thường note lại những thay đổi này trước khi commit. Nói một cách khác. thay vào đó nên dùng lệnh xóa của các subversion clients. trong trường hợp này chính là giao thức http.Minh họa về các revision của một repository Thông thường. thì mọi thao tác liên quan đến tập tin đó. hãy lấy một mô hình thông dụng về client/server đó là www. etc đều phải thông qua subversion. Một lưu ý rất căn bản đó là nếu bạn muốn subversion quản lí các phiên bản/thay đổi của một tập tin nào đó. ví dụ như Firefox hay IE. và một phần mềm client. 3. để cung cấp (serve) các dịch vụ Web. bạn nên tránh xóa một tập tin trong working copies bằng chức năng thông thường của file manager. Client và server phải có một số qui ước chung cho việc trao đổi với nhau. Các bước cài đặt Để cho dễ hình dung. tạo mới. ví dụ như dùng nút Del trong Explorer. để khi muốn quay trở lại trạng thái trước đó cũng rất dễ dàng. . để đứng trung gian giữa người dùng và phần mềm server.Hình 2 . để có thể nhận biết được những thay đổi qua mỗi lần commit. ví dụ như xóa. Những note này sẽ được lưu vào history để sau này khi view lên có thể nhận biết được hiện trạng của từng revision. bạn cần phải có một phần mềm server. hoặc IIS (nếu xài Windows).

Danh sách các phần mềm server tương ứng với các hệ điều hành có thể xem ở đây. Ví dụ Subclipse được tích hợp vào Eclipse (xem hình 3). thì phải nói là ko có gì đơn giản hơn. IDE plug-in clients là loại tích hợp vào các môi trường lập trình (IDE). Nếu bạn dùng Debian. Nếu bạn nhìn vào danh sách này thì sẽ thấy hoa cả mắt không biết chọn cái nào. Ví dụ như TortoiseSVN tích hợp vào Windows File Explorer. . desktopintegrated clients và IDE plug-in clients. Chọn phần mềm client mới là mệt mỏi. Stand-alone clients là loại đứng như một ứng dụng độc lập.Mô hình client/server của subversion Cũng tương tự như vậy. bỏ cái nào. khi dùng subversion (svn). bạn cần phải có một phần mềm server. và một phần mềm client (xem hình 1).Hình 1 . mỗi khi bạn click chuột phải trong màn hình của Windows File Explorer sẽ thấy các chức năng của svn client (xem hình 2). Tuy nhiên. Desktopintergrated clients là loại được tích hợp vào các phần mềm desktop. Các phần mềm svn client có thể chia làm 3 loại chính: stand-alone clients. nghĩa là không phụ thuộc vào phần mềm nào khác. Tôi cũng mất cả tuần nhưng cũng không có được câu trả lời ưng ý. cuối cùng thì cũng có một vài phương án khả dĩ. Ubuntu hay Fedora. chỉ cần một lệnh từ command line: apt-get install subversion (nếu là Debian hay Ubuntu).

. thì TortoiseSVN có lẽ là lựa chọn số 1.Hình 2 . hay các giao thức của svn như svn:// hoặc svn+ssh://. Ví dụ bạn có thể dùng các giao thức của ứng dụng web như http:// hoặc https://. rất nhanh. Nếu bạn dùng Windows.Subclipse tích hợp với Eclipse Subversion hỗ trợ khá nhiều giao thức để kết nối giữa client và server. Tôi đã xài thử qua thấy rất tiện. hoặc nếu phần mềm client và server cài chung trên 1 máy thì có thể dùng file:///. thì kdesvn cũng là một sự lựa chọn.TortoiseSVN tích hợp với Windows Explorer Hình 3 . Nếu bạn dùng Ubuntu Linux. Việc cho phép server hỗ trợ giao thức nào phụ thuộc vào lúc cấu hình.

ví dụ cài thử vài svn client lên để thử. nên chọn loại có thể hỗ trợ nhiều giao thức một chút. dịch và chạy trên đó. Bằng cách này tôi khỏi phải mất công chép tới chép lui code.3.nhưng tôi xài thì thấy rất khó chịu vì nó cực kì chậm.1. Cũng xin nói thêm một ý không kém phần quan trọng đó là tổ chức repository (xem chi tiết ở đây). subclipse cũng khá tốt. Có vẻ như AnkhSVN cũng là một lựa chọn không tồi. Tôi ko dùng Visual Studio nữa nên ko biết client nào là tốt cho VS. Tôi thì xài server Linux của lab để đặt repository. Codes Đây là tình huống thông dụng nhất. tôi xài subclipse. Eclipse chỉ hỗ trợ lập trình Java. code được viết để chạy cả trên Windows và Linux. chứ thao tác thì chậm ơi là chậm. nếu tôi xài máy Linux thì khi lập trình trong Eclipse. Bạn có thể tạo nhiều repository cho mình. Tuy nhiên tôi nghĩ nếu xài máy Linux cho phần mềm server và chọn giao thức svn+ssh để hỗ trợ thì việc cấu hình ko có gì khó khăn vì mọi cái đều theo mặc định mà làm). Do đó. Khi chọn client. nhất là khi code thay đổi xoành xoạch vì có bug. nếu tôi dùng máy Windows thì tôi xài TortoiseSVN. svn thì đã cài sẵn và có hỗ trợ giao thức svn+ssh nên tôi chỉ xài giao thức này để liên lạc giữa client và server (Thực sự là tôi ko biết cấu hình server như thế nào mặc dù có đọc qua tài liệu cấu hình server. tôi có thể thử nghiệm nhiều thứ. đồng thời cung cấp các hỗ trợ tiện lợi cho authentication (kiểm tra định danh khi bạn truy cập máy khác). Do đó. chạy khá nhanh. Eclipse Eclipse là IDE để lập trình. 4. lại quay lại trạng thái trước đó một cách dễ dàng. mỗi repository cho một mục đích khác nhau. hiệu chỉnh code. một repository để lưu virtual appliance và một repository để lưu codes của project XYZ. Mỗi khi install xong môi trường nào chạy thấy ổn định là commit. Khi muốn chạy ứng dụng trên Linux. Cũng tương tự như trường hợp Eclipse kể trên. tôi checkout về để cập nhật. Nói chung. sau đó commit lên lại. Nếu thử nghiệm sai. rồi tiếp tục thử nghiệm tiếp. Ví dụ repository để lưu eclipse. hoặc khi chuyển sang project mới. Lúc cài đặt ban đầu.2. 4. chắc là vì tôi dùng gnome chứ ko phải kde cho máy Linux của mình). Một số kịch bản sử dụng 4. cũng cần có cách để lưu lại các trạng thái stable của hệ thống. svn được dùng cho mục đích này. Cài đặt và sử dụng khá đơn giản. Do đó tôi để code tập trung trên repository. Mỗi lần cài như vậy có thể sẽ có những vấn đề liên quan đến tương thích. phải cài thêm plug-ins. 4. Nếu bạn lập trình bằng Eclipse. ngoài ra thì xài kdesvn (Tôi dùng kdesvn chỉ vì nó rất tiện cho phần authentication. tôi đặt thư mục Eclipse để cho svn quản lí. Virtual appliance Tôi dùng virtual appliance cho máy ảo Linux. Sau đó nếu dùng máy Windows. quan điểm là những gì độc . Về client. Trong hoàn cảnh của tôi. Nếu muốn hỗ trợ lập trình C++ hay PHP. tôi lại checkout ra trên máy Linux.

Tôi vẫn ko hiểu một số chuyện: .lập thì tách riêng thành các repository khác nhau. Nếu tôi muốn xóa các revision cũ hơn. thì ko biết làm cách nào. 5. svn khuyên nên tổ chức thành 3 thư mục con trong repository đó là trunk. kích thước của repository sẽ lớn lên. nếu xem ở ngoài file manager. thao tác và export các tables khi dùng các lệnh theo đúng cú pháp của mySQL. bạn sẽ ko thể nào thấy được cấu trúc repository của mình. Lê Đình Duy http://ledduy.svn lưu lại mọi thay đổi trong quá trình bạn thao tác trên các tập tin. Hi vọng là ở post sau. Một số điều bàn thêm Giống như khi bạn dùng một hệ quản trị csdl nào đó ví dụ như mySQL để quản lí các tables của mình. svn cũng tương tự. bạn sẽ ko thể nào "nhìn thấy" các tables này ở ngoài file manager thông thường (ví dụ Windows Explorer). Tôi đã đọc qua cũng hiểu vấn đề nhưng chưa trải qua dùng thực sự nên ko muốn viết ở đây. Sẽ đến một lúc nào đó. ví dụ như tập tin của máy ảo.blogspot. Bạn chỉ có thể thấy. .com .các phần mềm client ví dụ như TortoiseSVN có vẻ như tự động phát hiện sự thay đổi của tập tin nằm dưới sự kiểm soát của nó. Đối với code. Phải dùng svn clients mới có thể xem được. Có vẻ cũng ko đơn giản vì phải xài svndump và thêm mấy thứ lằng nhằng khác. còn những gì liên quan với nhau thì để chung trong một repository. cũng như những gì mình lưu trong repository. branches và tags. việc kiểm soát sự thay đổi nếu tập tin máy ảo được cập nhật thường xuyên có làm hệ thống chạy chậm đi hay không (giống như cài Norton Anti Virus vào thì copy dữ liệu cực chậm vì mỗi thao tác đọc/ghi đều phải qua NAV để kiểm tra virus). Giả sử tập tin này là rất lớn.

Sign up to vote on this title
UsefulNot useful