發布時間:2024-11-20
近日,百度發布了檢索增強的文生圖技術(iRAG),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,可以生成各種超真實的圖片,旨在解決大模型在圖片生成上的幻覺問題。
那么,這個技術到底有多真實?如何通過它生成高質量的圖片?下面,小編給大家展示一些生成的例子,以及,當文心iRAG面對提示詞刺客,是否依舊抗打。
傳送門:百度文心官方網站https://yiyan.baidu.com/
一、生成“無AI味”圖片的技巧
1.精準描述是關鍵
AI生成結果的好壞很大程度上取決于你的輸入描述(Prompt)。以下是一些示例:
● 明確主題:“一片冬日清晨的湖泊,湖面上有微薄的霧氣,遠處隱約可見雪山。”
● 細化細節:“20世紀風格的街景,地面有濕潤的磚石,街燈昏黃,帶有復古氛圍。”
● 融合情感:“一對戀人坐在秋日公園的長椅上,陽光灑下斑駁光影,背景是微風吹動的金黃色樹葉。”
描述小tips:避免使用模糊詞語,比如“美麗的”“獨特的”,要盡量具體。
2.選擇合適的風格
寫實風格:最適合想要生成自然場景、人物肖像的情況。
● 藝術插畫:用于設計書籍封面、動畫角色等。
● 未來科技:如果你需要科幻感的設計,這個模式是首選。
風格小tips:寫實風格更容易生成“無AI味”的圖片,但需要細化描述。
二、刁鉆的提示詞下還能“無AI味”嗎
上難度,以下提示詞設計了復雜的動態場景、文化符號和多層次元素的結合,看看文心iRAG表現如何,針對東方明珠、貝多芬、古羅馬斗獸場等特定地點和人物,是否會出現幻覺問題。
提示詞:“東方明珠塔夜景下的盛大煙火表演,背景中黃浦江的波光粼粼和對岸的高樓燈光清晰可見。塔身呈現紫色與粉色的燈光效果,頂部球體被煙火點綴成五彩斑斕的畫面,地面有游客舉著手機拍照,近景是一艘裝飾華麗的龍舟游艇。”
測試點:
· 東方明珠塔的細節(形狀、燈光分布)。
· 黃浦江及周邊建筑的準確性。
· 是否能將動態煙火與靜態場景合理結合。
· 是否生成不符合上海城市風格的元素。
2.提示詞:“貝多芬坐在鋼琴旁,身穿18世紀的深色燕尾服,他的桌上擺放著一張打開的樂譜,旁邊有一只點燃的蠟燭和一片凌亂的羽毛筆。背景是一個歐式古典風格的房間,窗外能看到星空。”
· 貝多芬的特征是否清晰(面部特征、服飾)。
· 房間與樂器的歷史真實性(鋼琴、蠟燭、羽毛筆)。
· 是否生成與時間背景矛盾的現代元素。
3.提示詞:“古羅馬斗獸場的日出場景,殘破的石墻被晨光染成金色,周圍環繞著典型的羅馬松樹。天空中飛過幾只鴿子,遠處的地平線上隱約可見古羅馬的其他建筑遺址。”
· 斗獸場的建筑細節(破損程度、石墻紋理)。
· 自然環境(松樹、鴿子)的真實感和協調性。
· 是否混入與古羅馬場景不符的元素(現代物品或建筑)。
看完以上例子,上海人民、貝多芬的“粉絲”、到過古羅馬斗獸場的旅客……大家來找碴,文心iRAG是否讀懂了提示詞,是否出現幻覺問題。當然,文心iRAG的亮相帶來了圖像生成領域的新驚喜,但它并不是無懈可擊的,也會出現瑕疵,尤其在復雜場景或冷門題材下,可這正是AI技術不斷進步的動力,期待AI生圖將“以假亂真”技能點滿的一天。
AI美圖
并行科技邀您共聚2024AGIC深圳(國際)通用人工智能產業博覽會
領馭科技將亮相AGIC深圳(國際)通用人工智能產業博覽會,“瀚鵬AI”打造企業新質生產力
【IOTE】專注大中功率RFID讀寫器的推廣—上海舜識將亮相IOTE國際物聯網展
【IOTE】RFID智能硬件識別解決方案商—瑞弗艾迪將亮相IOTE國際物聯網展
【IOTE】國內定制化物聯設備與特種電子標簽先驅品牌——鼎界物聯將亮相IOTE國際物聯網展
【IOTE】物聯網應用專家—羅維尼科技將亮相IOTE國際物聯網展
【IOTE】平頭哥邀你相聚2024IOTE國際物聯網展·深圳站
【IOTE】以位置服務為中心的物聯網芯片及解決方案供應商—芯與物將亮相IOTE國際物聯網展