Author Archives: Dylan Wan

測試OpenAI API

要先有OpenAI的帳號,還要拿到API 密鑰。

下面是步驟

1. 進入OpenAI Platform的網頁

    https://platform.openai.com/docs/overview

    如果沒有帳號,先申請一個。

    2. 然後建立一個專案

    點左下角的 Create Project,我起的名字是 HelloWorld.

    3. 進入 API的網頁,建立 密鑰 (API key)

    https://openai.com/api/

    點 Start Building

    進入下一個網頁

    點左下的 API Keys

    Read the rest of this entry

    GPT是模型,ChatGPT是產品

    GPT 是 Generative Pretrained Transformer 的縮寫

    GPT 是「預訓練的」、「生成式的」,「模型」

    它透過「學習」大量的的文章,產生對人類文字,以及程式語言的瞭解,產生能夠生成文字的能力。

    本質上是模仿,但也不完全是照抄,而是瞭解字和字,詞彙和詞彙,句子和句子,之間的關係。

    ChatGPT是一個應用程式,它使用GPT。來與人類對話。

    Read the rest of this entry

    學習PyTorch

    Pytorch是深度學習的工具,OpenAI發展ChatGPT也用PyTorch.

    這裡有很好的課程教材和範例:

    https://github.com/DataScienceHamburg/PyTorchUltimateMaterial/

    Read the rest of this entry

    LLM大語言模型的發展歷史

    這是我的筆記

    一開始,跟自然語言處理(nature language processing, NLP)有關.

    TF-IDF:TD在1957年,IDF在1972年,Google的搜尋有用到。

    n-Gram:n-gram 是通過 統計的機率,來依據前面的詞預測句子的下一個詞。

    中文輸入法有聯想輸入,就是一種應用,如果只有根據前面一個字或一個詞,預測不會很準。

    Read the rest of this entry

    人工智慧會取代人的工作嗎?

    有人覺得會,因為很多人能做的機器也能做

    例如插畫家,如果用midjourney可以畫,就不需要找人畫插畫了

    人工智慧不過是在重複過去的自動化,過去被取代的工作很多

    以前煮飯要先從生火開始,瓦斯爐取代了生火的工作

    Read the rest of this entry

    數據的預處理 – 標準化和正規化

    數據預處理 (Data Preparation) 是機器學習的步驟之一。

    但是有些觀念是統計學的,沒有要做機器學習可能也會用到。

    不同的變量他們的【數值的範圍】不同。

    當用他們來做預測或推論其他的變量,【數值的範圍】會影響到預測結果。

    Read the rest of this entry

    深度學習介紹:台大李宏毅教授

    有人認為這是中文講解中最好的。

    Read the rest of this entry

    自變數和依變數

    在統計以及實驗設計中,變數可以分類為自變數和依變數。

    研究統計學的人有興趣變數之間的關係。例如發展出迴歸分析的Francis Galton,當時他研究的是父母的身高和子女的身高的關係。

    自變數(Independent Variable)也叫獨立變數,在因果關係裡,是不被影響的變數。

    依變數(Dependent Variable)或稱之為因變數,或是應變數,是被假設為會被影響的變數。

    Read the rest of this entry

    重新複習線性代數

    這個影片有談到他是如何學習線性代數。

    Read the rest of this entry

    用numpy擷取子矩陣和向量

    我用的例子是來自 【均一教育】的子矩陣和向量的教學。

    下面的python程式用numpy把例子跑過一遍:

    import numpy as np
    ## 誠品書局一月到六月,產品銷售額
    誠品銷售額 = np.array(
               [[8,9,7,10,6,7],
                [20,31,33,28,21,35],
                [64,68,55,49,66,52]])
    
    ## 這是一個 3 x 6 的矩陣
    誠品銷售額.shape
    # 可以取一個子矩陣
    
    # 冒號是從A到B的「到」,如果左邊沒有寫出,就是從第一個開始,右邊沒寫出,就是最後一個
    # 第一個寫的是橫列,因為我們要所有的橫列,就用一個單獨的冒號來代表
    # 第二個寫的是要抽出的直行,在numpy,矩陣的index是由0開始,所以一月是0而二、三、四月是1到3
    # 要擷取時 Numpy的結尾是不包括在內的,所以要寫4,而不是3。
    
    誠品銷售額[:,1:4]
    Read the rest of this entry