AI
น้องๆ หลายคนคงเคยลองเล่น Stable Diffusion กันแล้วใช่ไหม? ไอ้เจ้า AI ที่เสกภาพจากตัวหนังสือเนี่ยแหละ แต่พอจะเริ่มจริงจังก็ต้องเลือกว่าจะใช้ตัวไหนดี ระหว่าง ComfyUI กับ Automatic1111 นี่แหละ วันนี้พี่บอมจะมาเล่าจากประสบการณ์ให้ฟัง ว่าแต่ละตัวมันมีดีมีเสียยังไง เหมาะกับใครบ้าง
Automatic1111 เนี่ย เหมือนรถเกียร์ออโต้ ใช้งานง่าย มี Extension ให้เล่นเยอะแยะ อยากได้อะไรก็ลงเพิ่มได้เลย แต่ ComfyUI มันเหมือนรถเกียร์ธรรมดา ต้องคลัตช์เอง เปลี่ยนเกียร์เอง แต่ข้อดีคือ เราควบคุมทุกอย่างได้หมด ปรับแต่งได้ละเอียดกว่าเยอะ เหมาะกับคนที่อยากจะเจาะลึกการทำงานของ Stable Diffusion จริงๆ
Automatic1111 (หรือ A1111) เนี่ย สมัยพี่เริ่มเล่น Stable Diffusion ใหม่ๆ ก็ใช้ตัวนี้แหละ เพราะมัน Set up ง่ายมาก แค่โหลดมาลง ก็ใช้งานได้เลย Interface ก็ User-Friendly สุดๆ
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
http://localhost:7860แค่นี้เอง! ง่ายใช่ไหมล่ะ แต่ถ้าใครเจอปัญหา ก็ลอง Google ดูนะ มีคนถามตอบไว้เยอะแยะเลย SiamCafe Blog ก็มีบทความเกี่ยวกับ Stable Diffusion อยู่บ้าง ลองเข้าไปอ่านดูได้
ComfyUI เนี่ย จะเน้นไปที่การสร้าง Workflow เป็น Node-based Interface เราต้องต่อ Node แต่ละ Node เอง เพื่อกำหนดการทำงานของ Stable Diffusion ตั้งแต่ Load Model จนถึง Save Image
ComfyUI จะไม่มี Interface ให้พิมพ์ Prompt แบบ A1111 นะ เราต้องสร้าง Node เพื่อใส่ Prompt เอง ซึ่งแรกๆ อาจจะงงๆ หน่อย แต่พอเข้าใจแล้ว จะรู้ว่ามันเจ๋งขนาดไหน
อันนี้เป็น Code Workflow ง่ายๆ ที่ Load Model, ใส่ Prompt, แล้ว Save Image
{
"nodes": [
{
"id": 1,
"type": "Load Checkpoint",
"inputs": {
"ckpt_name": "sd_xl_base_1.0.safetensors"
},
"outputs": [
"MODEL",
"CLIP",
"VAE"
]
},
{
"id": 2,
"type": "CLIP Text Encode (Prompt)",
"inputs": {
"text": "a photo of a cat",
"CLIP": 1
},
"outputs": [
"CONDITIONING"
]
},
{
"id": 3,
"type": "Empty Latent Image",
"inputs": {
"width": 512,
"height": 512,
"batch_size": 1
},
"outputs": [
"LATENT"
]
},
{
"id": 4,
"type": "K Sampler",
"inputs": {
"seed": 0,
"steps": 20,
"cfg": 8,
"sampler_name": "euler_a",
"scheduler": "normal",
"positive": 2,
"negative": 5,
"latent_image": 3,
"model": 1
},
"outputs": [
"LATENT"
]
},
{
"id": 5,
"type": "CLIP Text Encode (Prompt)",
"inputs": {
"text": "bad anatomy, ugly, deformed",
"CLIP": 1
},
"outputs": [
"CONDITIONING"
]
},
{
"id": 6,
"type": "VAEDecode",
"inputs": {
"samples": 4,
"vae": 1
},
"outputs": [
"IMAGE"
]
},
{
"id": 7,
"type": "Save Image",
"inputs": {
"filename_prefix": "cat",
"images": 6
}
}
]
}
อันนี้เป็นแค่ตัวอย่างนะ Workflow จริงๆ มันซับซ้อนกว่านี้เยอะ แต่หวังว่าน้องๆ จะเห็นภาพว่า ComfyUI มันทำงานยังไง
| คุณสมบัติ | Automatic1111 | ComfyUI |
|---|---|---|
| ความง่ายในการติดตั้ง | ง่ายมาก | ปานกลาง |
| ความง่ายในการใช้งาน | ง่ายมาก | ยาก (ต้องเรียนรู้ Workflow) |
| ความยืดหยุ่นในการปรับแต่ง | ปานกลาง (ผ่าน Extension) | สูงมาก |
| ประสิทธิภาพในการใช้ Resource | ปานกลาง | ดี |
| Community Support | ดีมาก (Extension เยอะ) | ดี |
| เหมาะสำหรับ | มือใหม่, ผู้ที่ต้องการความสะดวก | ผู้ที่ต้องการปรับแต่งละเอียด, นักวิจัย |
สรุปแล้ว ถ้าเป็นมือใหม่ พี่แนะนำให้เริ่มจาก Automatic1111 ก่อนนะ พอเริ่มคล่องแล้ว ค่อยมาลอง ComfyUI ก็ได้ SiamCafe Blog มีบทความอื่นๆ เกี่ยวกับ AI อีกเยอะ ลองเข้าไปอ่านดูนะ
ดูวิดีโอเพิ่มเติมเกี่ยวกับComfyUI vs Automatic1111 เปรีย:
A: ไม่จริง ComfyUI กิน Spec เครื่องน้อยกว่า Automatic1111 เพราะมัน Optimize การทำงานได้ดีกว่า แต่ ComfyUI อาจจะต้องการ RAM เยอะหน่อย ถ้า Workflow มันซับซ้อนมากๆ
A: ใช่ Extension บางตัวอาจจะทำให้ Automatic1111 ทำงานช้าลงได้ ดังนั้น ลง Extension ที่จำเป็นจริงๆ ก็พอ
A: ทำได้ ComfyUI สามารถสร้าง Animation ได้ แต่ต้องใช้ Workflow ที่ซับซ้อนพอสมควร
สมัยผมทำร้านเน็ต เคยเจอเด็กมันเซ็ตเครื่องพัง เพราะไปลงโปรแกรมมั่วซั่ว ComfyUI ก็เหมือนกันน้อง เก็บ workflow เป็นไฟล์ .json ให้ดี ตั้งชื่อให้สื่อความหมาย จะได้ไม่ต้องมานั่งงมทีหลัง
# ตัวอย่างการตั้งชื่อไฟล์ workflow
my_cool_image_workflow_v1.json
Prompt นี่สำคัญมาก! ยิ่งใช้ AI สร้างภาพ Prompt ยิ่งเป็นหัวใจหลัก Save prompt ที่ใช้แล้วได้ภาพสวยๆ เก็บไว้เลยน้อง ผมแนะนำให้เก็บใส่ text file หรือใส่ description ในไฟล์ workflow เลยก็ได้
ComfyUI มันเปิดกว้างให้เราลง Custom Node ได้เยอะมาก น้องลองไปหา node ที่เค้าทำไว้ดีๆ มาใช้ จะช่วยให้ workflow ของเราง่ายขึ้นเยอะเลย แต่ก่อนลงก็ดู review ดีๆ หน่อยนะ เดี๋ยวเจอ node แอบฝังอะไรแปลกๆ มา
ถ้าเครื่องแรงๆ ก็ดีไป แต่ถ้าเครื่องไม่แรง ก็ต้องปรับแต่ง ComfyUI ให้มัน optimize หน่อย พวก batch size, resolution, sampler method พวกนี้มีผลหมด ลองปรับดูว่าค่าไหนมัน balance ระหว่างความเร็วกับคุณภาพ
เอาจริงๆ ก็กินอยู่นะน้อง ถ้าเทียบกับ Automatic1111 ที่ optimize มาดีแล้ว ComfyUI มันจะดึงพลังเครื่องมากกว่า โดยเฉพาะ GPU ถ้า GPU ไม่แรง อาจจะต้องลด resolution หรือ batch size ลงมาหน่อย
มีหลายที่เลยน้อง ลอง Google ดู พวกเว็บที่แชร์ AI Art ส่วนใหญ่จะมีคนเอา workflow มาแชร์กัน หรือจะลองเข้าไปดูใน SiamCafe Blog ก็ได้ เผื่อมีคนใจดีเอามาแปะไว้ให้
ถ้ามือใหม่แบบไม่เคยแตะ AI Image Generation เลย อาจจะต้องใช้เวลาเรียนรู้นิดนึง แต่ถ้าเคยใช้ Automatic1111 มาบ้างแล้ว ComfyUI ก็ไม่ได้ยากเกินไปหรอกน้อง ลองเปิดใจดู
มันอยู่ที่ความชอบเลยน้อง ถ้าชอบความง่าย สะดวก Automatic1111 ก็ตอบโจทย์ แต่ถ้าชอบความยืดหยุ่น อยากปรับแต่งอะไรได้เยอะๆ ComfyUI ก็เจ๋งกว่าเยอะ iCafeForex สมัยก่อนก็มีเครื่องให้ลูกค้าลองทั้งสองแบบเลย แล้วแต่คนชอบ
ComfyUI กับ Automatic1111 มันก็มีข้อดีข้อเสียต่างกันไป น้องลองเล่นทั้งสองตัว แล้วดูว่าตัวไหนมันตอบโจทย์เราที่สุด แต่ที่แน่ๆ AI Image Generation นี่มันมาแรงจริงๆ ใครไม่ลองเล่นถือว่าพลาด!