Author Archives: Dylan Wan
測試OpenAI API
要先有OpenAI的帳號,還要拿到API 密鑰。
下面是步驟
1. 進入OpenAI Platform的網頁
https://platform.openai.com/docs/overview
如果沒有帳號,先申請一個。
2. 然後建立一個專案
點左下角的 Create Project,我起的名字是 HelloWorld.
3. 進入 API的網頁,建立 密鑰 (API key)
點 Start Building
進入下一個網頁
點左下的 API Keys
Read the rest of this entryGPT是模型,ChatGPT是產品
GPT 是 Generative Pretrained Transformer 的縮寫
GPT 是「預訓練的」、「生成式的」,「模型」
它透過「學習」大量的的文章,產生對人類文字,以及程式語言的瞭解,產生能夠生成文字的能力。
本質上是模仿,但也不完全是照抄,而是瞭解字和字,詞彙和詞彙,句子和句子,之間的關係。
ChatGPT是一個應用程式,它使用GPT。來與人類對話。
Read the rest of this entry學習PyTorch
Pytorch是深度學習的工具,OpenAI發展ChatGPT也用PyTorch.
這裡有很好的課程教材和範例:
https://github.com/DataScienceHamburg/PyTorchUltimateMaterial/
Read the rest of this entryLLM大語言模型的發展歷史
這是我的筆記
一開始,跟自然語言處理(nature language processing, NLP)有關.
TF-IDF:TD在1957年,IDF在1972年,Google的搜尋有用到。
n-Gram:n-gram 是通過 統計的機率,來依據前面的詞預測句子的下一個詞。
中文輸入法有聯想輸入,就是一種應用,如果只有根據前面一個字或一個詞,預測不會很準。
Read the rest of this entry人工智慧會取代人的工作嗎?
有人覺得會,因為很多人能做的機器也能做
例如插畫家,如果用midjourney可以畫,就不需要找人畫插畫了
人工智慧不過是在重複過去的自動化,過去被取代的工作很多
以前煮飯要先從生火開始,瓦斯爐取代了生火的工作
Read the rest of this entry數據的預處理 – 標準化和正規化
數據預處理 (Data Preparation) 是機器學習的步驟之一。
但是有些觀念是統計學的,沒有要做機器學習可能也會用到。
不同的變量他們的【數值的範圍】不同。
當用他們來做預測或推論其他的變量,【數值的範圍】會影響到預測結果。
Read the rest of this entry自變數和依變數
在統計以及實驗設計中,變數可以分類為自變數和依變數。
研究統計學的人有興趣變數之間的關係。例如發展出迴歸分析的Francis Galton,當時他研究的是父母的身高和子女的身高的關係。
自變數(Independent Variable)也叫獨立變數,在因果關係裡,是不被影響的變數。
依變數(Dependent Variable)或稱之為因變數,或是應變數,是被假設為會被影響的變數。
Read the rest of this entry用numpy擷取子矩陣和向量
我用的例子是來自 【均一教育】的子矩陣和向量的教學。
下面的python程式用numpy把例子跑過一遍:
import numpy as np
## 誠品書局一月到六月,產品銷售額
誠品銷售額 = np.array(
[[8,9,7,10,6,7],
[20,31,33,28,21,35],
[64,68,55,49,66,52]])
## 這是一個 3 x 6 的矩陣
誠品銷售額.shape
# 可以取一個子矩陣
# 冒號是從A到B的「到」,如果左邊沒有寫出,就是從第一個開始,右邊沒寫出,就是最後一個
# 第一個寫的是橫列,因為我們要所有的橫列,就用一個單獨的冒號來代表
# 第二個寫的是要抽出的直行,在numpy,矩陣的index是由0開始,所以一月是0而二、三、四月是1到3
# 要擷取時 Numpy的結尾是不包括在內的,所以要寫4,而不是3。
誠品銷售額[:,1:4]
Read the rest of this entry