SAM分割大模型简明教程

Google Colab 是一个基于云的 Jupyter 笔记本环境，允许您通过浏览器编写、运行和共享 Python 代码。它就像 Google 文档，但用于代码。

通过免费版本的 Google Colab，你可以获得带有约 16GPU VRAM 的 Nvidia Tesla T4 GPU，这对于我们正在做的事情非常有用。

1、访问 Google Colab

要开始使用 Google Colab 并利用 GPU 加速，请按照以下步骤操作：

访问Colab并使用你的 Google 帐户登录。
单击“File”>“New notebook”以创建新笔记本。
单击“Runtime”>“Change runtime type”，将运行时更改为使用 GPU。在“Hardware accelerator”下拉列表中，选择“GPU”，然后单击“Save”。

现在我们已准备好使用启用了 GPU 的 Google Colab。

2、安装 Metaseg

首先，通过在新的代码单元中运行以下命令来安装 Metaseg 库：

!pip install metaseg

!pip 命令在 Google Colab 中用于安装环境中未预安装的 Python 包。通过运行 !pip install metaseg，我们在 Colab 环境中安装了 Metaseg 库。

接下来，使用左侧的文件浏览器将图像上传到你的 Google Colab 环境。在此示例中，我们将使用名为 smudge.png 的图像

要显示上传的图像，请运行以下代码：

from IPython.display import Image
Image("smudge.png")

现在，从metaseg库导入 SegAutoMaskPredictor类：

from metaseg import SegAutoMaskPredictor

然后，创建 SegAutoMaskPredictor 类的实例并使用它来分割图像，代码如下：

results = SegAutoMaskPredictor().image_predict(
    source="smudge.png",
    model_type="vit_l", # vit_l, vit_h, vit_b
    points_per_side=16, 
    points_per_batch=64,
    min_area=0,
    output_path="output.png",
    show=False,
    save=True,
)

注意：
1.我设置了 show=False，因为它在Google Colab中不起作用。这将立即显示输出图像。在我们的例子中，我们将单独显示它。
2. 如果要保存图像，请确保设置 save=True 。

最后，通过运行以下命令显示带有蒙版的分割图像：

from IPython.display import Image
Image("output.jpg")

就是这样！你已成功使用 Facebook 的 SAM 和 Google Colab 中的 Metaseg 库来分割图像。

请随意进一步探索并尝试不同的图像和设置。

原文链接：Get Started with Facebook Segment Anything (SAM) in Colab

BimAnt翻译整理，转载请标明出处