略過導覽
跳到主要內容
Skip to primary sidebar
Skip to secondary sidebar
Skip to footer

Author Archives: Dylan Wan

測試OpenAI API

Posted by Dylan Wan

要先有OpenAI的帳號，還要拿到API 密鑰。

下面是步驟

1. 進入OpenAI Platform的網頁

https://platform.openai.com/docs/overview

如果沒有帳號，先申請一個。

2. 然後建立一個專案

點左下角的 Create Project，我起的名字是 HelloWorld.

3. 進入 API的網頁，建立密鑰（API key）

https://openai.com/api/

點 Start Building

進入下一個網頁

點左下的 API Keys

Read the rest of this entry →

張貼於AI, 大語言模型, 人工智慧

標籤： OpenAI

GPT是模型，ChatGPT是產品

Posted by Dylan Wan

GPT 是 Generative Pretrained Transformer 的縮寫

GPT 是「預訓練的」、「生成式的」，「模型」

它透過「學習」大量的的文章，產生對人類文字，以及程式語言的瞭解，產生能夠生成文字的能力。

本質上是模仿，但也不完全是照抄，而是瞭解字和字，詞彙和詞彙，句子和句子，之間的關係。

ChatGPT是一個應用程式，它使用GPT。來與人類對話。

Read the rest of this entry →

張貼於AI, 大語言模型, 人工智慧

學習PyTorch

Posted by Dylan Wan

Pytorch是深度學習的工具，OpenAI發展ChatGPT也用PyTorch.

這裡有很好的課程教材和範例：

https://github.com/DataScienceHamburg/PyTorchUltimateMaterial/

Read the rest of this entry →

張貼於AI, 自然語言處理, Python語言, 深度學習, 人工智慧

LLM大語言模型的發展歷史

Posted by Dylan Wan

這是我的筆記

一開始，跟自然語言處理（nature language processing, NLP）有關.

TF-IDF：TD在1957年，IDF在1972年，Google的搜尋有用到。

n-Gram：n-gram 是通過統計的機率，來依據前面的詞預測句子的下一個詞。

中文輸入法有聯想輸入，就是一種應用，如果只有根據前面一個字或一個詞，預測不會很準。

Read the rest of this entry →

張貼於自然語言處理, 大語言模型, 機器學習

人工智慧會取代人的工作嗎？

Posted by Dylan Wan

有人覺得會，因為很多人能做的機器也能做

例如插畫家，如果用midjourney可以畫，就不需要找人畫插畫了

人工智慧不過是在重複過去的自動化，過去被取代的工作很多

以前煮飯要先從生火開始，瓦斯爐取代了生火的工作

Read the rest of this entry →

張貼於人工智慧

標籤：人工智慧

數據的預處理 – 標準化和正規化

Posted by Dylan Wan

數據預處理（Data Preparation）是機器學習的步驟之一。

但是有些觀念是統計學的，沒有要做機器學習可能也會用到。

不同的變量他們的【數值的範圍】不同。

當用他們來做預測或推論其他的變量，【數值的範圍】會影響到預測結果。

Read the rest of this entry →

張貼於統計學, 機器學習

深度學習介紹：台大李宏毅教授

Posted by Dylan Wan

有人認為這是中文講解中最好的。

Read the rest of this entry →

張貼於Uncategorized

標籤：機器學習

自變數和依變數

Posted by Dylan Wan

在統計以及實驗設計中，變數可以分類為自變數和依變數。

研究統計學的人有興趣變數之間的關係。例如發展出迴歸分析的Francis Galton，當時他研究的是父母的身高和子女的身高的關係。

自變數（Independent Variable）也叫獨立變數，在因果關係裡，是不被影響的變數。

依變數（Dependent Variable）或稱之為因變數，或是應變數，是被假設為會被影響的變數。

Read the rest of this entry →

張貼於統計學, 機器學習

重新複習線性代數

Posted by Dylan Wan

這個影片有談到他是如何學習線性代數。

Read the rest of this entry →

張貼於基本數學基礎

用numpy擷取子矩陣和向量

Posted by Dylan Wan

我用的例子是來自【均一教育】的子矩陣和向量的教學。

下面的python程式用numpy把例子跑過一遍：

import numpy as np
## 誠品書局一月到六月，產品銷售額
誠品銷售額 = np.array(
           [[8,9,7,10,6,7],
            [20,31,33,28,21,35],
            [64,68,55,49,66,52]])

## 這是一個 3 x 6 的矩陣
誠品銷售額.shape

# 可以取一個子矩陣

# 冒號是從A到B的「到」，如果左邊沒有寫出，就是從第一個開始，右邊沒寫出，就是最後一個
# 第一個寫的是橫列，因為我們要所有的橫列，就用一個單獨的冒號來代表
# 第二個寫的是要抽出的直行，在numpy，矩陣的index是由0開始，所以一月是0而二、三、四月是1到3
# 要擷取時 Numpy的結尾是不包括在內的，所以要寫4，而不是3。

誠品銷售額[:,1:4]

Read the rest of this entry →

張貼於Python語言