September
4th,
2023
投影片: https://docs.google.com/presentation/d/1wTEt3sy7ZHk3rYO3nFYhPZEFrfpG70l6WzY12wIaycE/edit?usp=sharing
簡單摘要:
RAG (Retrieval Augmented Generation) 主要講的是透過查詢資料,透過 LLM 做為結果的生成回覆。
準備資料: 讀取資料,切割成 chunk ,加上 Embedding ,放入 Vector DB
讀取資料: 輸入轉換成 Embedding 比對 Vector ,找出 Chunk ,放入 LLM 來生成回答
困難點:
檢索(Retrieval) 的資料不夠好,就算你 model 用 gpt20 (講者真的這樣說)也沒救。
如何在系統層上面做到即時資料更新?
改善方式:
挑選好切割工具(parser) : 推薦 LlamaHub ,Unstructured-IO/unstructured
加強檢索的資料(放一些 metadata) : e.g. 頁碼,章節敘述 ….
建立一個 data pair (doc_hash_id, ver_num),更新比較快。
產品介紹: LlamaIndex https://www.llamaindex.ai/
支援多種 Loader: Llama hub
支援 Document Update:
https://gpt-index.readthedocs.io/en/stable/core_modules/data_modules/index/usage_pattern.html#handling-document-update
Metadata Extraction
Document Management
關於 Llama-Index 教學資源
繼續閱讀
August
27th,
2023
資料來源
中文翻譯新聞: https://news.cnyes.com/news/id/5292495
原文來自 podcast 是前 Google Tensorflow 核心開發者之一 - Ali Yahya,很推薦聽 。
想法
裡面提到一些想法蠻有趣的,透過四個面向來講解未來商機: (相互排斥,現狀挑戰,如何合作形成新的商業模式,AI與社交圖譜)
我挑幾個有趣的提出
透過 zk 加密的方式 (ZKML, 中文文章) ,來讓 LLM 可以達到分散式 AI 訓練。並且可以讓原來的人才拿到正確資料。 (這邊我不是很懂 zk / zkml ,有空再來了解)
可以設想這樣一種情況:Alice 有一個想要保護的模型。她想把模型以加密的形式發送給 Bob,Bob 現在收到加密模型,需要在這個加密模型上運行自己的數據。如何做到這一點呢?那就要利用所謂的全同態加密計算加密數據。如果用戶擁有加密模型和明文數據,那麼就可以在明文數據上運行加密模型,接收並獲得加密結果。你將加密結果發回給 Alice,她就能解密並看到明文結果。
裡面有提到一個激勵機制:
大型 LLM 開放給大家使用。
單獨用法使用者提供更好的客製化資料,讓模型優化。(得到激勵)
讓模型變得更好。
以往音樂平台透過 blockchain 加密讓創作者可以跟大家交流,現在透過 LLM AI 每個參與者都可以變成「創作者」。他們也有了新的交流模式。
繼續閱讀
August
26th,
2023
非普通三國-寫給年輕人看的三國史
作者: 普通人 插畫: 山本恩
出版社:方寸文創事業有限公司
買書推薦網址:
Readmoo: 購買網址
前言:
這是 2023 年第八本讀完的書。這類有趣的歷史書籍,都會是我書單裡面常備的休閒書籍,我大概都會交互著看,所以這一本跟上一本可以馬上緊接著看完。(其實手上還有五本以上讀了一半)
這是講解許多你不熟悉的三國時代的書籍,雖然說我們常玩電動的人對於三國時代的武將都如數家珍(可能更多是他的武力跟政治力),但是這邊介紹的往往是一些比較冷門的歷史故事:
為何曹操會被稱為人妻殺手
趙子龍的相關八卦
甚至是孔融相關故事,還有三國後期的一些人物典故也都有放上。其實也還蠻有趣的。
內容摘要:
數學家:「這應該是我最近最開心的一次閱讀。」
心理學家:「此書的唯一缺點,就是讓人欲罷不能。」
律師:「如果要理解簡明三國史,這本書是最好入手的工具。」
歷史學者:「用二十一世紀的人關心的重點,告訴你全新的三國!」
大學教授:「即使這幾年人文普及寫作當道,但普通人仍是其中翹楚。」
專欄作家:「這本書不只是在還原歷史,更是在補一般人認知上的空白。」
網站創辦人:「普通人的故事很不設限,就像豪邁的說書人,比喻即使誇張也一定能讓人秒懂。」
國小教師:「以各種新穎寫法還原歷史真相,藉由精心設計的安排勾勒出三國英雄們的真性情。」
歷史作家:「不管如何KUSO,文字如何誇張,內容都有憑有據,顯示作者的紮實基本功,看似普通,其實不簡單。」
連羅貫中都不知道的三國史!
超越傳統史學格局,融合電玩動漫戲劇時事鄉民哏,
上萬粉絲狂敲鍵盤催促,終於等到──
「故事:寫給所有人的歷史」網站超高人氣專欄《三國蜘蛛網》首度結集!
人妻王曹孟德:
因為當初三國時代其實很多地方的將領都喜歡取漂亮年輕的女子為老婆。
再攻下相關領地後,曹操在佔領相關資源的時候就看上。
趙子龍的八卦就是談他劉備很像很親密的樣子。
提到袁紹的兩個大軍事:沮授跟田豐
有提到心眼很小的曹丕:
很愛記仇(曹洪)
跟曹植的愛恨情仇
臧霸(比較少人知道)但是其實在三國後期也是管理很多地方的將領。
還有提到三國時代的鬼怪故事:蟲落族(頭會飛的怪民族)
講到很猛但是運勢不好的馬超
家裡好像犯太歲的孫權
三國小白的孔融
有提到其實孔明算是非常仁慈的軍師(很少在處死刑)
心得:
這一本真的算是很有趣的,作者也試著使用各種文筆寫法來講解一些通俗歷史。比如說是透過記者採訪的文筆,比如說透過類似藍色蜘蛛網的寫法,甚至是透過一些比喻來講解三國時代許多有趣的通俗歷史。
這一本相當適合閒暇時候翻一下,也可以讓我自己對於三國時代的武將數字後面有了更多的了解。甚至對於三國時代的相關歷史與生活習慣也有了更多的了解。
繼續閱讀
August
24th,
2023
高效團隊都在用的奇蹟式提問
激發互動+建立心理安全感的最強提問公式,會議不沈默,討論不冷漠,每次協作都有成效
問いかけの作法 チームの魅力と才能を引き出す技術
共 4 人評分
作者: 安齋勇樹
譯者: 林佑純
出版社:天下雜誌出版
買書推薦網址:
Readmoo: 購買網址
前言:
這是 2023 年第七本讀完的書。偶然間看到這本書,想到老闆每次跟我 1 on 1 的時候都會提醒我要透過有效率的提問方式來做到團隊管理的方式,就不自主想買下這本書。 日本書籍經常有的特典,就是又薄又經典,可以很快速了解重點。 很適合我閱讀效率。
內容摘要:
一個公式X四個原則,以引導取代領導,
扭轉討論發散、沉默、沒效率的無力感,
掌握有效提問點方法,激發最高生產力。
你在主持會議、帶領小組討論時,是否經常碰到這樣的窘境:
請大家發言,結果是一片恐怖的死寂;
徵詢意見,大家你看我、我看你,就是每一個開口;
明明在討論新企劃,最後卻變成產品檢討⋯⋯
發散、沒進度、沒想法,不只讓負責人壓力山大,更嚴重影響團隊生產力。
這一切都可以改變!你需要「奇蹟式提問」。
本書作者安齋勇樹服務超過三千家企業導入「奇蹟式提問」建立具備心理安全感基礎的強大團隊。他發現,組織成員對於所屬團體常有「沒人提出好點子」、「沒有團隊精神」的無力感,這種無力感一旦蔓延,往往導致個人和團體停滯成長。
他以心理學與組織管理學為基礎,結合實戰經驗,歸納出「奇蹟式提問」的技巧,無論是在主持會議、小組討論,或是一對一溝通,都能透過這個方法,提升與人連結的能力,強化團隊生產力。
從工廠團隊到工作坊形團隊
認知團隊潛力
溝通不良,誰的錯?
工廠型團隊:
主管導向
從上到下
依規定做事
工作坊型團隊:
從下到上
自發性找尋問題,尋找解法
經營層協助確定目標
動機: 參考這本書 讀書心得-動機、單純的力量(DRIVE: The Surprising Truth About What Motivates Us)
這故事就是「三個砌磚工人」,在中世紀的某個歐洲小鎮,於建築工地有三名工人在工作。當被問到「你在做什麼呢?」時,各個工人分別如此回答:
第一個工人說:「我在堆磚頭。」
第二個工人說:「我在賺錢啊。」
第三個工人開朗地抬起頭來說:「我在建造本鎮將流傳後世的大教堂啊!」
來源:https://www.managertoday.com.tw/articles/view/59101?utm_source=copyshare
©經理人
奇蹟提問的公式與原則
提問會引導回答:
單純事件提問 -> 回想
一年前吃什麼 -> 搜尋資料
有推薦的店家嗎? –> 分享資訊
提問的四個原則:
尊重成員個性,不否定。
為什麼這樣做? –> 你這樣做想強調的是什麼?
我明白了 –> 為什麼會這樣想?
適度限制,給予思考空間。
有什麼想法? –> 目前專案中,什麼讓你覺得浪費時間?
避免過度嚴肅,給人樂意回答。
你有好主意嗎? –> 如果要你拒絕提案,你的理由會是什麼?
適度打破既定的規則。
如何讓使用者更方便? –> 什麼樣的產品不太方便,但是你想擁有他?
提問公式:
觀察:
與會人士姿勢
為何特別在意某些內容?
根據哪些價值觀的發言?
組合:
會議中的角色
提案型
激勵型
組織型
共感型
結合問題三步驟:
定義未知問題
調整方向
給予限制
提問
好提問,吸引注意力
前情提要加提問
共感突破武裝
如果我們一起承擔風險,你想要選擇哪個方案?
煽動情感
我相信你的專業,想聽聽意見。
留白空間:
大家還記得今天會議主題嗎? (停三秒)…… 今天會議是….
追蹤反饋:
查看相關回應給予下一步。
補充意義
釋出善意
心得:
這本書透過三個大主軸:
澄清提問的重要性
好提問的相關原則
如何進行一個好提問
來開始本書的結構,這一本書透過許多小句子可以很快速地了解每一個小章節的相關含義。也更容易去施行。
搭配著最後一個章節給予相關工作坊的施行辦法,可以讓參與的人可以更快地體會提問的方式與重要性。也可以很快速的施行。
繼續閱讀
August
23rd,
2023
記錄一下,相關旅遊紀錄。 08/11 法國英國藝術之旅第一天: 很興奮到了法國第一餐找了附近的餐廳 「 La Musset」 結果評價很高。不過在法國吃飯真的會很花時間,服務生不能趕,上菜真的不快,也不能催他付錢。 下午先去凱旋門感受一下壯觀的景象,再來就是去「奧塞美術館」感受一下許多漂亮的雕像跟作品。至少有看過「拾穗」。 晚餐吃了飯店樓下的義大利餐廳。很雷。 飯店: Hôtel Louvre Saint-Honoré 早餐: Le Musset 3’ 凱旋門 奧塞美術館 晚餐太雷(省略) 08/12 法國跟愛丁堡藝術之旅 第二天 羅浮宮 先去是「聖心堂」感受莊嚴的美麗 再來去後面的「小丘廣場」看到藝術家部落的壯觀。 「午餐: La Vache et le Cuisinier 是個很棒的體驗。」 馬不停蹄趕去看「艾菲爾鐵塔」 最後到了「羅浮宮」感受跨千年的美麗。 傍晚去搭 「city tour」逛逛整個巴黎。 晚餐老婆跟小孩說吃膩了法國麵包,結果跑去吃法國的中國菜。 08/13 法國與英國藝術之旅 今天準備要飛到英國愛丁堡,參加爸媽很期待的「愛丁堡藝術節」。 因為是下午的飛機,早上馬不停蹄去趕行程。 先感受了 「聖徒修道院」美麗的馬賽克藝術,再來到了藝術與科技結合的巴黎古監獄。 巴黎古監獄透過與平板的互動,加上尋寶遊戲。讓本來還蠻空曠的巴黎古監獄多了很多有趣的感覺。他的商品街也是讓我們買不停。最後還是有經過大火過後的「巴黎聖母院」,雖然都不能進去,但是可以看到周圍人潮還是很多。也看到許多修復的進度表。 最後晚上終於「回到」愛丁堡,十多年前來跨年過後,讓我們念念不忘的城市。 因為太累,吃了一個比較安全的連鎖亞洲菜餐廳就結束今天行程。 聖徒修道院 巴黎古監獄 聖母院 巴黎戴高樂機場(機場三明治$ 愛丁堡機場 晚餐: wagamama 飯店 : The Scotsman Hotel 08/14 法國英國藝術遊: 享受愛丁堡藝術節的路邊表演 早上起床享受了飯店的早餐之後,慢慢往「聖吉爾斯教堂」逛過去,也走到「愛丁堡大學」的後面 「underbelly 」會場享受這次有買票的 「Amazing bible man」真的很棒,很有趣。 後來走出來後到了旁邊的餐廳用餐整個 pizza 相當美味。查了之後才知道是當地 pizza. 名店、只是因為下午剛開。 後來去逛了 「Harry potter 的專賣店」東西其實不多,反而對面的綜合商品專賣店有滿滿的商品。 之後走回 Royal Miles 上面,發現有滿滿的街邊表演。真的都超有趣,結果就看到晚上九點多。。超讚的。 晚餐是街邊看到的店面,結果是飯店的餐廳。 牛排的口感超好, Fish and chips 也是一流。 飯店: Scotsman Hotel 聖吉爾斯教堂 Underbelly 午餐: Paolozzi Restaurant & Bar Harry Potter 專賣店 Royal Miles 表演 A: 台灣來的魔術師 B: The great mimic 超好笑的互動,跟超強的滾球。 C: The James 一個街頭資深手法的魔術師。很多手法都看不出來。 D: Mr. Banana 一個雜耍人,最後用球包住自己超強。 E: 忘記名字,一個像是雜耍團的華人,真的很厲害欸。 晚餐: Luckenbooths 08/15 法國與英國藝術之旅 - 重頭戲: 愛丁堡城堡與軍樂節表演 早上吃完早餐就去愛丁堡城堡去逛。整個城堡相當的莊嚴與宏偉。也彌補了十幾年前來訪愛丁堡沒有機會進去看的遺憾。 逛完城堡後去了旁邊的「格紋工廠」。 中午在陽光下吃了一間義大利餐廳。算是中規中矩。享受陽光下的愛丁堡看著表演真的很棒。但是好日子沒有太久(笑) 接近傍晚就開始下大雨。 晚餐吃餐廳是「蘇格蘭菜」。我吃了一個馬鈴薯燉飯很喜歡。 到了軍樂節會場,雖然下著大雨相當不方便。但是全部還是滿場。全場活動有數個軍樂隊的表演。除了震撼人心的軍樂音樂外,還有許多串場的舞蹈與燈光煙火表演。 最後全部的大合唱 Story 真的太令人感動了。蘇格蘭風笛出現的時候,臉頰熱熱的。 原來是熱淚盈眶。 這幾天的感受是: - 如果你還二十多歲: 千萬別錯過「愛丁堡藝術節」 Fringe 除了有各種有趣的表演,來看看各國人年輕人創意真的很棒。我希望我每年都能來。 - 不論你幾歲,千萬別錯過「愛丁堡軍樂節表演」 他說會感動人心,一輩子都不會忘記的體驗。 早餐: 飯店...
繼續閱讀
August
4th,
2023
小專案 Online PDF Viewer and Parse Data compare:
https://github.com/kkdai/pdf_online_editor
比對你準備要導入的檔案,透過 PyPDF 。
有在使用 PDF vector embedding 的人,但是又不知道導入資料長什麼樣子,可以透過這個小工具來查看 build by streamlit。
最近由於在弄 LangChain 花了很多時間在玩 Python ,不過很多東西之前沒注意過。這裡稍微筆記一下:
PyPDF2 有 CVE 問題,其實切回PyPDF
可以用 pip freeze 跟 pipreqs搭配使用來打造 requirements.txt
Heroku 可以透過 Aptfile 來達到安裝 apt get 套件的方式:
導入 "url": "heroku-community/apt" buildpack
加入 Aptfile 裡面放你需要的套件清單 (e.g. pyimage 需要 poppler-utils)
參考: How to add apt packages to Heroku 不然就是上面的 repo 。
Streamlit 是個好工具,對於我這種前端小白,提供了以下一些超好用東西:
各種的資料輸入格式
Session State: 一個線上類似 cookie / session 的好東西
繼續閱讀