Subversion (SVN) Lê Đình Duy

1. Tại sao cần Subversion Tôi hiện có một chương trình face detector cho phép detect faces trong images (chuyện này OpenCV cũng làm được), và cho phép detect eyes trong detected faces (OpenCV ko có chức năng này). Chương trình này tôi viết từ hồi học PhD và sử dụng khá hiệu quả cho nhiều ứng dụng khác nhau. Tuy nhiên, do chương trình vẫn có một số bugs nên sau vài lần sửa, mỗi lần lưu một nơi khác nhau mà ko có chú thích gì; hậu quả là cho đến giờ, ngồi nhìn 5 copies của chương trình này, tôi ko biết ct nào là phiên bản cuối cùng ko còn bug nữa. Đây là một ví dụ trong số rất nhiều ví dụ của tôi liên quan đến quản lí các phiên bản của chương trình trong quá trình lập trình. Cách làm thông thường là mỗi phiên bản lưu thành 1 thư mục. Sau đó, mỗi khi có project mới thì lại copy thư mục này sang thư mục của project mới, đồng thời vẫn giữ lại thư mục cũ để phòng khi có thể quay lại phiên bản cũ, nếu các cập nhật trong project mới bị lỗi. Làm tới, làm lui vài lần, cuối cùng ko biết mình sửa cái gì, ở đâu, khi nào. Đó cũng chính là lí do tôi cần có một cách quản lí hiệu quả hơn về các sự thay đổi trong quá trình tiến hóa của các code tôi viết. Các version control systems như subversion (svn) chính là giải pháp mà tôi cần tìm.

Version control is the art of managing changes to information. It has long been a critical tool for programmers, who typically spend their time making small changes to software and then undoing or checking some of those changes the next day. Imagine a team of such developers working concurrently - and perhaps even simultaneously on the very same files! - and you can see why a good system is needed to manage the potential chaos.

Có khá nhiều hệ thống hỗ trợ version control, ví dụ như cvs, subversion, git, etc. Ban đầu tôi chỉ biết cvs, nhưng sau đó mới biết thêm subversion, git. Sau khi tìm hiểu, tôi quyết định chọn subversion bởi vì subversion là "hậu duệ" của cvs, ra đời để khắc phục những hạn chế của cvs (hạn chế gì của cvs mà subversion có thể giải quyết, tôi chỉ mới nghe nói, ko hiểu gì vì chưa xài cvs và so sánh nó với subversion bao giờ!). Hiện nay subversion được sử dụng khá thông dụng trong rất nhiều dự án mã nguồn mở. Git mới ra đời gần đây, viết bởi tác giả của Linux. Trong bài nói chuyện của mình ở Google Talk, Linus chỉ trích subversion là sai về nguyên tắc cơ bản. Ý chính ở đây theo tôi hiểu đó là cách quản lí. Git của Linux dùng cơ chế phân tán (distributed), trong khi cvs và subversion dùng cơ chế tập trung (client/server). Tôi thì thích kiểu client/server hơn nên đã chọn subversion.

Hình 1 . nhưng toàn bộ các tập tin của repository sẽ có cùng một con số revision.c-rev2 phải có nội dung khác nhau. trong khi working copies có thể có nhiều (tương ứng với repository đó). Subversion cung cấp các công cụ để nhận biết sự thay đổi của các tập tin ở working copies so với repository.c-rev1 và foo.c-rev1 và foo. . và thao tác này gọi là merge .c-rev2 là 2 revision của tập tin foo. Mô hình này có 2 khái niệm cơ bản: Repository đặt ở server là nơi tập trung quản lí các phiên bản của các tập tin. Một số khái niệm Subversion dựa trên mô hình quản lí tập trung kiểu client/server. Một điểm cần lưu ý là trong subversion. Để quản lí các phiên bản khác nhau. Cứ mỗi lần commit. đây là vấn đề phức tạp nhất. Ví dụ foo. toàn bộ repository sẽ có một con số revision mới (mỗi con số này là duy nhất và số của revision sau lớn hơn số của revision trước). anh ta sẽ dùng lệnh commit. đồng thời cũng cung cấp công cụ để giúp việc merge được dễ dàng. anh ta sẽ dùng lệnh update. Working Copies đặt ở client là các phiên bản làm việc của các tập tin trong repository. Trường hợp P1 và P2 cùng cập nhật một tập tin. Repository thì chỉ có một. Nói một cách đơn giản. dù chỉ thay đổi một tập tin sau lệnh commit.2. subversion dùng khái niệm revision. Sau đó. ví dụ P1. để hệ thống có thể quản lí được sự thay đổi của các tập tin.c. Nếu P2 muốn thấy những thay đổi của P1 trên repository cập nhật xuống phiên bản đang dùng của mình. P2 sẽ checkout để lấy 1 phiên bản copy các file của project A này về máy cục bộ của mình (gọi là working copies). mỗi tập tin sẽ có dạng Name-Revision. Do đó.Mô hình client/server Một kịch bản thường thấy là các tập tin của project A được lưu ở repository. ko nhất thiết là foo. mỗi thành viên của project A. Mỗi khi P1 muốn các thay đổi trên các tập tin của project A ở máy cục bộ của mình cập nhật lên repository.

để cung cấp (serve) các dịch vụ Web. .Minh họa về các revision của một repository Thông thường. để có thể nhận biết được những thay đổi qua mỗi lần commit. ví dụ như Apache HTTP server. Những note này sẽ được lưu vào history để sau này khi view lên có thể nhận biết được hiện trạng của từng revision. để khi muốn quay trở lại trạng thái trước đó cũng rất dễ dàng. ví dụ như Firefox hay IE. 3. Client và server phải có một số qui ước chung cho việc trao đổi với nhau. để thực hiện các yêu cầu tương ứng với phần mềm server (request). sửa. tạo mới. ví dụ như dùng nút Del trong Explorer. và một phần mềm client. Nói một cách khác. Các bước cài đặt Để cho dễ hình dung. ví dụ như xóa. thì mọi thao tác liên quan đến tập tin đó. để đứng trung gian giữa người dùng và phần mềm server. etc đều phải thông qua subversion. người ta thường note lại những thay đổi này trước khi commit. bạn cần phải có một phần mềm server. hãy lấy một mô hình thông dụng về client/server đó là www.Hình 2 . trong trường hợp này chính là giao thức http. Một lưu ý rất căn bản đó là nếu bạn muốn subversion quản lí các phiên bản/thay đổi của một tập tin nào đó. Trong mô hình này. hoặc IIS (nếu xài Windows). bạn nên tránh xóa một tập tin trong working copies bằng chức năng thông thường của file manager. thay vào đó nên dùng lệnh xóa của các subversion clients.

Tuy nhiên. thì phải nói là ko có gì đơn giản hơn. Ubuntu hay Fedora. Danh sách các phần mềm server tương ứng với các hệ điều hành có thể xem ở đây. Các phần mềm svn client có thể chia làm 3 loại chính: stand-alone clients. và một phần mềm client (xem hình 1). chỉ cần một lệnh từ command line: apt-get install subversion (nếu là Debian hay Ubuntu). Chọn phần mềm client mới là mệt mỏi. mỗi khi bạn click chuột phải trong màn hình của Windows File Explorer sẽ thấy các chức năng của svn client (xem hình 2). nghĩa là không phụ thuộc vào phần mềm nào khác. IDE plug-in clients là loại tích hợp vào các môi trường lập trình (IDE). Desktopintergrated clients là loại được tích hợp vào các phần mềm desktop. bạn cần phải có một phần mềm server.Mô hình client/server của subversion Cũng tương tự như vậy. bỏ cái nào. Ví dụ như TortoiseSVN tích hợp vào Windows File Explorer. Nếu bạn nhìn vào danh sách này thì sẽ thấy hoa cả mắt không biết chọn cái nào. desktopintegrated clients và IDE plug-in clients. cuối cùng thì cũng có một vài phương án khả dĩ. Stand-alone clients là loại đứng như một ứng dụng độc lập. khi dùng subversion (svn). Nếu bạn dùng Debian. Ví dụ Subclipse được tích hợp vào Eclipse (xem hình 3). Tôi cũng mất cả tuần nhưng cũng không có được câu trả lời ưng ý.Hình 1 . .

hoặc nếu phần mềm client và server cài chung trên 1 máy thì có thể dùng file:///. thì kdesvn cũng là một sự lựa chọn. Tôi đã xài thử qua thấy rất tiện. Nếu bạn dùng Ubuntu Linux. thì TortoiseSVN có lẽ là lựa chọn số 1. hay các giao thức của svn như svn:// hoặc svn+ssh://.Hình 2 . Ví dụ bạn có thể dùng các giao thức của ứng dụng web như http:// hoặc https://. rất nhanh.Subclipse tích hợp với Eclipse Subversion hỗ trợ khá nhiều giao thức để kết nối giữa client và server. .TortoiseSVN tích hợp với Windows Explorer Hình 3 . Việc cho phép server hỗ trợ giao thức nào phụ thuộc vào lúc cấu hình. Nếu bạn dùng Windows.

svn được dùng cho mục đích này. đồng thời cung cấp các hỗ trợ tiện lợi cho authentication (kiểm tra định danh khi bạn truy cập máy khác). Nói chung. Tôi thì xài server Linux của lab để đặt repository. code được viết để chạy cả trên Windows và Linux. chắc là vì tôi dùng gnome chứ ko phải kde cho máy Linux của mình). 4. Cài đặt và sử dụng khá đơn giản. ngoài ra thì xài kdesvn (Tôi dùng kdesvn chỉ vì nó rất tiện cho phần authentication. tôi đặt thư mục Eclipse để cho svn quản lí. tôi lại checkout ra trên máy Linux. Tuy nhiên tôi nghĩ nếu xài máy Linux cho phần mềm server và chọn giao thức svn+ssh để hỗ trợ thì việc cấu hình ko có gì khó khăn vì mọi cái đều theo mặc định mà làm). Virtual appliance Tôi dùng virtual appliance cho máy ảo Linux. 4. Nếu thử nghiệm sai. chứ thao tác thì chậm ơi là chậm. hiệu chỉnh code. nên chọn loại có thể hỗ trợ nhiều giao thức một chút. Nếu bạn lập trình bằng Eclipse. Khi chọn client.3. Do đó. Cũng tương tự như trường hợp Eclipse kể trên. Sau đó nếu dùng máy Windows.1. lại quay lại trạng thái trước đó một cách dễ dàng. Bạn có thể tạo nhiều repository cho mình. Do đó tôi để code tập trung trên repository. tôi checkout về để cập nhật. mỗi repository cho một mục đích khác nhau. subclipse cũng khá tốt. quan điểm là những gì độc . Cũng xin nói thêm một ý không kém phần quan trọng đó là tổ chức repository (xem chi tiết ở đây). Eclipse chỉ hỗ trợ lập trình Java. Eclipse Eclipse là IDE để lập trình. một repository để lưu virtual appliance và một repository để lưu codes của project XYZ. nếu tôi dùng máy Windows thì tôi xài TortoiseSVN.2. tôi có thể thử nghiệm nhiều thứ. dịch và chạy trên đó. Do đó. Codes Đây là tình huống thông dụng nhất. Về client. Tôi ko dùng Visual Studio nữa nên ko biết client nào là tốt cho VS. rồi tiếp tục thử nghiệm tiếp. nếu tôi xài máy Linux thì khi lập trình trong Eclipse. Mỗi khi install xong môi trường nào chạy thấy ổn định là commit. ví dụ cài thử vài svn client lên để thử. chạy khá nhanh.nhưng tôi xài thì thấy rất khó chịu vì nó cực kì chậm. Nếu muốn hỗ trợ lập trình C++ hay PHP. svn thì đã cài sẵn và có hỗ trợ giao thức svn+ssh nên tôi chỉ xài giao thức này để liên lạc giữa client và server (Thực sự là tôi ko biết cấu hình server như thế nào mặc dù có đọc qua tài liệu cấu hình server. phải cài thêm plug-ins. Bằng cách này tôi khỏi phải mất công chép tới chép lui code. Trong hoàn cảnh của tôi. tôi xài subclipse. Mỗi lần cài như vậy có thể sẽ có những vấn đề liên quan đến tương thích. 4. Lúc cài đặt ban đầu. cũng cần có cách để lưu lại các trạng thái stable của hệ thống. Có vẻ như AnkhSVN cũng là một lựa chọn không tồi. Một số kịch bản sử dụng 4. Ví dụ repository để lưu eclipse. Khi muốn chạy ứng dụng trên Linux. sau đó commit lên lại. hoặc khi chuyển sang project mới. nhất là khi code thay đổi xoành xoạch vì có bug.

còn những gì liên quan với nhau thì để chung trong một repository. việc kiểm soát sự thay đổi nếu tập tin máy ảo được cập nhật thường xuyên có làm hệ thống chạy chậm đi hay không (giống như cài Norton Anti Virus vào thì copy dữ liệu cực chậm vì mỗi thao tác đọc/ghi đều phải qua NAV để kiểm tra virus). Nếu tôi muốn xóa các revision cũ hơn. cũng như những gì mình lưu trong repository. branches và tags. Hi vọng là ở post sau. Một số điều bàn thêm Giống như khi bạn dùng một hệ quản trị csdl nào đó ví dụ như mySQL để quản lí các tables của mình. Có vẻ cũng ko đơn giản vì phải xài svndump và thêm mấy thứ lằng nhằng khác.lập thì tách riêng thành các repository khác nhau. thao tác và export các tables khi dùng các lệnh theo đúng cú pháp của mySQL.svn lưu lại mọi thay đổi trong quá trình bạn thao tác trên các tập tin. Đối với code.các phần mềm client ví dụ như TortoiseSVN có vẻ như tự động phát hiện sự thay đổi của tập tin nằm dưới sự kiểm soát của nó. Tôi đã đọc qua cũng hiểu vấn đề nhưng chưa trải qua dùng thực sự nên ko muốn viết ở đây. nếu xem ở ngoài file manager. Bạn chỉ có thể thấy. ví dụ như tập tin của máy ảo. .com . Giả sử tập tin này là rất lớn. bạn sẽ ko thể nào "nhìn thấy" các tables này ở ngoài file manager thông thường (ví dụ Windows Explorer). Phải dùng svn clients mới có thể xem được. 5. Lê Đình Duy http://ledduy. thì ko biết làm cách nào.blogspot. kích thước của repository sẽ lớn lên. Tôi vẫn ko hiểu một số chuyện: . svn cũng tương tự. Sẽ đến một lúc nào đó. svn khuyên nên tổ chức thành 3 thư mục con trong repository đó là trunk. bạn sẽ ko thể nào thấy được cấu trúc repository của mình.

Sign up to vote on this title
UsefulNot useful