
Hướng dẫn cài đặt Gephi
Trước khi bắt đầu, bạn cần đảm bảo máy tính của mình đã được cài đặt Java Development Kit (JDK). Gephi là một ứng dụng Java và sẽ không chạy nếu không có JDK. Chúng ta nên cài đặt các phiên bản JDK từ version 11 trở lên để tương thích với chương trình. Bạn có thể tải Java JDK (ví dụ: từ Eclipse Temurin (AdoptOpenJDK) hoặc Oracle). Ở đây tác giả sử dụng bản của Oracle.
1. Cài đặt trên Windows
-
Tải Gephi: Truy cập trang web chính thức của Gephi: https://gephi.org/ và tải về tệp cài đặt cho Windows (thường là tệp
.exe). -
Chạy tệp cài đặt: Mở tệp
.exebạn vừa tải về. -
Làm theo hướng dẫn:
* Một trình hướng dẫn cài đặt (setup wizard) sẽ xuất hiện.
* Bạn chỉ cần nhấn "Next" (Tiếp theo), đồng ý với các điều khoản ("I Agree").
* Trình cài đặt có thể sẽ tự động phát hiện phiên bản Java JDK bạn đã cài.
* Chọn thư mục cài đặt (thường để mặc định) và nhấn "Install" (Cài đặt).
Hình 1: Giao diện hướng dẫn cài đặt Gephi trên Windows.
- Hoàn tất: Sau khi cài đặt xong, nhấn "Finish" (Hoàn tất). Bạn sẽ tìm thấy biểu tượng Gephi trong Start Menu hoặc trên Desktop.
2. Cài đặt trên macOS
-
Tải Gephi: Truy cập https://gephi.org/ và tải về tệp cài đặt cho macOS (thường là tệp
.dmg). -
Mở tệp .dmg: Nhấp đúp vào tệp
.dmgbạn vừa tải. Một cửa sổ Finder sẽ xuất hiện. -
Kéo vào Applications: Trong cửa sổ đó, bạn sẽ thấy biểu tượng Gephi và một lối tắt đến thư mục "Applications" (Ứng dụng).
-
Hãy kéo biểu tượng Gephi và thả vào thư mục Applications.
Hình 2: Kéo biểu tượng Gephi vào thư mục Applications để cài đặt.
- Chạy lần đầu tiên:
* macOS có một tính năng bảo mật tên là Gatekeeper, có thể sẽ chặn bạn mở Gephi ngay lập tức.
* Để chạy lần đầu tiên, hãy vào thư mục Applications, tìm Gephi, nhấn chuột phải (hoặc Control + nhấp) vào biểu tượng và chọn Open (Mở).
* Một hộp thoại cảnh báo sẽ xuất hiện, nhưng lần này nó sẽ có thêm nút Open (Mở). Hãy nhấn vào đó. Bạn chỉ cần làm điều này một lần duy nhất.
Hình 3: Giao diện chào mừng của Gephi khi được mở lần đầu.
Hướng dẫn sử dụng Gephi
Gephi là một công cụ dùng để trực quan hóa và phân tích các mạng lưới (network), nhất là các mạng đồ thị (graph) dành cho ngành khoa học dữ liệu. Chúng ta sẽ sử dụng nó để xem xét dữ liệu từ dự án inventory_optimization. Các bạn có thể xem toàn bộ dự án mẫu ở đây.
Khác với việc phải import hai tệp nodes và edges riêng biệt (như mặc định của Gephi), dự án này đã cung cấp sẵn một tệp .graphml, là một định dạng chuẩn cho dữ liệu đồ thị mà Gephi có thể đọc trực tiếp.
Bước 1: Chuẩn bị dữ liệu
Trước tiên, bạn cần tải tệp dữ liệu mạng lưới từ GitHub.
-
Truy cập repository: https://github.com/nguyenhads/inventory_optimization/tree/master/visualizations
-
Tải về tệp sau về máy tính của bạn.
Hình 4: Tệp dữ liệu `store_transfer_network.graphml` cần tải về.
Mẹo: Trong thư mục này cũng có một tệp
gephie_v01.gephi. Đây là tệp dự án Gephi đã được hoàn thiện. Bạn có thể tải về và mở trực tiếp bằng Gephi (File > Open...) để xem ngay kết quả cuối cùng mà không cần thực hiện các bước mở ở trên. Tuy nhiên, để học cách sử dụng, bạn nên làm theo hướng dẫn với tệp.graphml.
Bước 2: Mở project và import dữ liệu
-
Mở Gephi. Bạn sẽ thấy màn hình chào mừng (Welcome). Hãy chọn New Project (Dự án mới).
-
Đi đến menu
File > Open...hoặc sử dụng phím tắt (Ctrl + O). -
Chọn tệp
store_transfer_network.graphmlbạn vừa tải về. -
Một cửa sổ "Import report" sẽ hiện ra, báo cáo số lượng Nút (Nodes) và Cạnh (Edges) được tìm thấy trong tệp. Hãy đảm bảo các thông số đúng và nhấn OK.
Hình 5: Cửa sổ "Import report" xác nhận số lượng nút và cạnh đã được nạp.
Bước 3: Kiểm tra dữ liệu
Sau khi nhập xong, để kiểm tra xem dữ liệu đã được nạp đúng chưa, hãy chuyển sang tab Data Laboratory (Thí nghiệm dữ liệu).
Hình 6: Giao diện "Data Laboratory" nơi dữ liệu được hiển thị dưới dạng bảng.
Tại đây, bạn có thể nhấn vào tab "Nodes" và "Edges" để xem dữ liệu dạng bảng. Bạn sẽ thấy các thuộc tính của nút và cạnh đã được nạp đầy đủ.
Bước 4: Trực quan hóa (Overview)
Hãy chuyển về tab Overview (Tổng quan). Ban đầu, bạn sẽ thấy một mớ các nút và cạnh chồng chéo lên nhau (thường gọi là "hairball"). Chúng ta cần sắp xếp chúng.
Hình 7: Đồ thị ở dạng "hairball" ban đầu trong cửa sổ "Graph".
- Chạy thuật toán layout:
* Ở cửa sổ "Layout" (Bố cục) bên trái, hãy chọn một thuật toán để sắp xếp đồ thị.
* Các lựa chọn phổ biến bao gồm ForceAtlas 2 hoặc Yifan Hu.
Hình 8: Bảng cài đặt thông số cho thuật toán layout "Yifan Hu".
- Chọn một thuật toán (ví dụ: Yifan Hu) và nhấn nút Run (Chạy).
- Bạn sẽ thấy các nút bắt đầu di chuyển và tự sắp xếp lại. Hãy để nó chạy cho đến khi mạng lưới trông ổn định, sau đó nhấn Stop (Dừng).
Hình 9: Đồ thị đã được sắp xếp lại sau khi chạy thuật toán.
- Điều chỉnh giao diện (Appearance):
* Bây giờ, chúng ta sẽ làm cho đồ thị dễ đọc hơn bằng cách sử dụng màu sắc và kích thước.
* Ở cửa sổ "Appearance" (Giao diện) phía trên bên trái, chọnNodes(Nút) và tabColor(Màu sắc).
* ChọnPartition(Phân vùng).
* Trong menu thả xuống, chọn một thuộc tính (Attribute) để tô màu. Ví dụ: nếu dữ liệu có cột 'Component', hãy chọn nó. Gephi sẽ tự động gán màu khác nhau cho mỗi cụm. Nhấn Apply.
* Tương tự, bạn có thể điều chỉnh Kích thước (Size) của nút. Chọn tabSize, chọnRanking(Xếp hạng), và chọn một thuộc tính số nhưTotal Units In(Số hàng hoá nhập vào). Nhấn Apply.
Hình 10: Giao diện điều chỉnh kích thước các nút trong bảng "Appearance".
Hình 11: Đồ thị sau khi kích thước nút được điều chỉnh theo số lượng hàng nhập vào.
Bước 5: Lọc dữ liệu (Filters)
Sau khi đã có một cái nhìn tổng quan về mạng lưới, bước tiếp theo là đi sâu vào phân tích bằng cách sử dụng bộ lọc (Filters). Chức năng này cho phép bạn ẩn bớt các nút (nodes) và cạnh (edges) không cần thiết để tập trung vào những đối tượng thỏa mãn một điều kiện cụ thể.
Hình 12: Giao diện tổng quan của chức năng "Filters".
Dựa vào hình ảnh, chúng ta có thể thấy cách sử dụng bộ lọc để trả lời một câu hỏi cụ thể về dữ liệu.
-
Truy cập bảng Filters
* Ở phía bên phải của giao diện, bạn sẽ thấy tab Filters. -
Xây dựng một truy vấn (query)
* Trong tab Filters, bạn sẽ thấy một Library (Thư viện) chứa rất nhiều loại bộ lọc, được xếp vào các danh mục nhưAttributes(Thuộc tính),Edges(Cạnh),Dynamic(Động)...
* Trong hình ảnh, ta đang xây dựng một bộ lọc dựa trên thuộc tính của các nút. Cụ thể, query đang dùng trong ảnh làAttributes->Partition.
* Truy vấn được xây dựng làEQUAL (total_units_out). Điều này có nghĩa là chúng ta muốn tìm các nút có thuộc tínhtotal_units_outbằng một giá trị nhất định. Thuộc tính này có thể đại diện cho tổng số sản phẩm mà một kho hàng đã xuất đi. -
Thiết lập thông số cho bộ lọc
* Sau khi kéo bộ lọcEQUAL (total_units_out)vào vùng "Queries", một bảng điều khiển cài đặt sẽ xuất hiện ở phía dưới.
* Tại đây, ta đã đặt Value (Giá trị) là 217.
* Toàn bộ thiết lập này có nghĩa là: "Hãy chỉ hiển thị những nút (ví dụ: cửa hàng, kho) nào có tổng số đơn vị hàng hóa xuất đi (total_units_out) chính xác là 217." -
Áp dụng bộ lọc
* Sau khi thiết lập xong, bạn chỉ cần nhấn vào nút Filter để áp dụng.
* Kết quả là, tab "Graph" sẽ chỉ hiển thị những nút và cạnh liên quan thỏa mãn điều kiện. Như bạn thấy trong hình, đồ thị đã được lọc và chỉ còn lại một vài nút hiển thị (chú thích "Nodes: 2 (10% visible)").
Chưa có bình luận nào. Hãy là người đầu tiên!