Sau cấu trúc: tư thế, chữ trong dấu ngoặc, điều phối đa ảnh, ràng buộc «phẫu thuật» và vòng lặp bốn bước—tất cả cho GPT Image 2.
Loạt bài:(I) Mô hình & tham số · (II) Nền tảng prompt · (IV) Tình huống tạo ảnh · (V) Tình huống chỉnh sửa · (VI) Nhất quán nhân vật
1. Người, tư thế và hành động
Nếu có hình người, hãy chỉ rõ:
- Tỷ lệ nhân vật / bao nhiêu cơ thể hiện ra
- Hướng ánh mắt
- Tương tác với đạo cụ
Ví dụ ngắn
- «Toàn thân; chân nhìn thấy.»
- «Trẻ phải trông nhỏ hơn so với bàn.»
- «Mắt nhìn cuốn sách mở—không nhìn ống kính.»
- «Tay cầm vô-lăng tự nhiên.»
Giúp giảm tỷ lệ sai, tư thế cứng và mắt lạc hướng.
2. Ràng buộc: đổi so với giữ
- Loại trừ: watermark, chữ thừa, nhãn hiệu
- Khi chỉnh sửa: «Chỉ đổi X; phần còn lại giữ nguyên.»
- Mỗi vòng lặp nhắc lại phần giữ: danh tính, hình học, grading, logo
- Chỉnh «phẫu thuật»: cấm chạm độ bão hòa/tương phản/mũi tên/nhãn/máy ảnh/đạo cụ bối cảnh nếu không phải mục tiêu
3. Chữ trong ảnh
- Bọc nội dung bắt buộc trong dấu ngoặc kép
- Mô tả thứ bậc, bảng màu, vị trí
- Đánh vần thương hiệu khó từng chữ
- Chữ dày / nhiều font → nâng lên
medium/high
4. Nhiều ảnh đầu vào
Thứ tự chặt + vai trò được gọi tên:
- Image 1: ảnh sản phẩm
- Image 2: tham chiếu phong cách
- Image 3: môi trường/nền
Câu ghép
- «Áp phong cách Image 2 lên Image 1.»
- «Đặt chim Image 1 lên voi Image 3.»
5. Lặp theo lớp
Nhịp đề xuất
- Gửi baseline tối giản trước
- Chẩn đoán chỗ sai
- Chỉnh một nút (độ ấm, xóa đạo cụ, mở khoảng âm)
- Nhắc lại ràng buộc trước vòng tiếp theo
Prompt dài che lỗi—quay lại khung sạch khi drift tích tụ.
Kiểm soát hiếm khi là «thêm chữ»—mà là chỉ dẫn có thể thực thi.
👉 Tải nhiều ảnh tham chiếu—luyện compositing và chỉnh sửa có kỷ luật.
Bắt đầu dùng GPT-image2