.cursorrules
.llmrules
本文件旨在建立一套涵蓋軟體開發全流程與 AGI 輔助技術的整體指引,幫助團隊與個人達成快速原型 (POC) 開發、知識積累與持續優化。文件整合了以下各部分內容:
Sign in to like and favorite skills
.llmrules
Code Style and Structure
Here are some pieces of information you need to know about this project:
本文件旨在建立一套涵蓋軟體開發全流程與 AGI 輔助技術的整體指引,幫助團隊與個人達成快速原型 (POC) 開發、知識積累與持續優化。文件整合了以下各部分內容:
啟動命令提示字元:按下
Win + R,輸入 cmd,然後按 Enter。
切換目錄:使用
cd,例如 cd C:\path\to\project。
列出檔案與資料夾:使用
dir。
建立資料夾:使用
mkdir 資料夾名稱。
刪除檔案:使用
del 檔案名稱。
刪除資料夾:使用
rmdir /S /Q 資料夾名稱(包含子目錄且不提示)。
複製檔案:使用
copy 來源 目的地。
移動檔案/資料夾:使用
move 來源 目的地。
執行 Python 腳本:使用
python script.py 或 py script.py。
串接多重指令:
使用
&& 僅當前一指令成功時才執行下一指令,例如:
mkdir test && cd test
使用
|| 僅當前一指令失敗時執行下一指令,例如:
type missing.txt || echo File not found
使用
& 不論前一指令成功或失敗都執行下一指令,例如:
echo step1 & echo step2
PowerShell 為 Windows 上進階的殼層(shell)與指令腳本環境,與 Linux shell(bash/zsh)在語法與物件模型上有以下主要差異:
物件導向管線:PowerShell 的管線傳遞物件,而非純文字。例如:
Get-Process | Where-Object { $_.CPU -gt 100 }
指令(cmdlet)命名慣例:多為
動詞-名詞 格式,如 Get-ChildItem、Set-Location,對應 Linux 的 ls、cd。
變數宣告:變數前需加
$,且不需顯式宣告類型,例如:
$files = Get-ChildItem -Path . -Filter *.txt
切換目錄:使用
Set-Location(別名 cd)、Push-Location / Pop-Location 管理位置堆疊。
列出檔案:使用
Get-ChildItem(別名 ls, dir)、可搭配 -Recurse 深度搜尋。
建立資料夾:使用
New-Item -ItemType Directory -Name 資料夾名稱。
刪除檔案/資料夾:使用
Remove-Item 路徑;加 -Recurse 刪除子目錄,加 -Force 忽略提示。
複製檔案:使用
Copy-Item來源 -Destination 目的地。
移動檔案/資料夾:使用
Move-Item 來源 -Destination 目的地。
執行 Python 腳本:與 CMD 相同,使用
python script.py,但可在同一行中搭配 PowerShell 參數。
執行腳本設定:預設禁止執行腳本,可透過
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser 設定執行策略。
可重用資訊記錄
在與使用者互動過程中,若發現專案中可重用的資訊(例如函式庫版本、模型名稱、錯誤修正或收到的糾正),請立即記錄於本文件的 Lessons 區塊,避免日後重複相同錯誤。
Scratchpad 作為思考與記錄工具
seaborn(因近期版本變更)。/data_mining_course/ │ ├── modules/ │ ├── module_01_eda_intro/ # 模組1:課程導入與EDA複習 │ │ ├── slides/ │ │ │ └── 01_course_introduction.pptx │ │ ├── notebooks/ │ │ │ ├── 01_pandas_basics.ipynb # Pandas基礎操作複習 │ │ │ ├── 02_data_visualization.ipynb # 資料視覺化技巧 │ │ │ └── 03_exploratory_analysis.ipynb # 探索性分析方法 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_02_data_cleaning/ # 模組2:資料清理與預處理複習 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_chunking_large_files.ipynb # 大檔案分塊處理 │ │ │ ├── 02_handling_duplicates.ipynb # 重複值處理 │ │ │ ├── 03_data_type_conversion.ipynb # 資料型態轉換 │ │ │ └── 04_text_cleaning.ipynb # 文字欄位清理 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_03_missing_outliers/ # 模組3:缺失值與異常值處理 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_missing_data_overview.ipynb # 缺失值概述 │ │ │ ├── 02_imputation_methods.ipynb # 各種插補方法比較 │ │ │ ├── 03_outlier_detection.ipynb # 異常值檢測方法 │ │ │ └── 04_house_prices_case.ipynb # House Prices資料集實作 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_04_categorical_encoding/ # 模組4:類別變數編碼方法 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_label_onehot_encoding.ipynb # 標籤與獨熱編碼 │ │ │ ├── 02_count_frequency_encoding.ipynb # 計數與頻率編碼 │ │ │ ├── 03_target_encoding.ipynb # 目標編碼 │ │ │ ├── 04_high_cardinality.ipynb # 高基數特徵處理 │ │ │ └── 05_titanic_case.ipynb # Titanic資料集實作 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_05_scaling_transformation/ # 模組5:特徵縮放與變數轉換 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_scaling_methods.ipynb # 縮放方法比較 │ │ │ ├── 02_power_transformations.ipynb # 冪轉換方法 │ │ │ ├── 03_outliers_impact.ipynb # 異常值對縮放的影響 │ │ │ └── 04_insurance_case.ipynb # 保險資料集實作 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_06_feature_creation/ # 模組6:特徵創造 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_interaction_features.ipynb # 交互特徵創建 │ │ │ ├── 02_group_aggregations.ipynb # 分組聚合特徵 │ │ │ ├── 03_time_derivatives.ipynb # 時間衍生特徵 │ │ │ └── 04_nyc_taxi_case.ipynb # NYC計程車資料集實作 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_07_feature_selection/ # 模組7:特徵選擇與降維 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_filter_methods.ipynb # 過濾法特徵選擇 │ │ │ ├── 02_wrapper_methods.ipynb # 包裹法特徵選擇 │ │ │ ├── 03_embedded_methods.ipynb # 嵌入法特徵選擇 │ │ │ ├── 04_dimensionality_reduction.ipynb # 降維技術 │ │ │ └── 05_breast_cancer_case.ipynb # 乳癌資料集實作 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_08_time_series/ # 模組8:時間序列特徵工程 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_lag_features.ipynb # 滯後特徵 │ │ │ ├── 02_rolling_windows.ipynb # 滑動窗口特徵 │ │ │ ├── 03_date_time_features.ipynb # 日期時間特徵 │ │ │ ├── 04_seasonality_trend.ipynb # 季節性與趨勢分解 │ │ │ └── 05_power_consumption_case.ipynb # 電力消耗資料集實作 │ │ ├── exercises/ │ │ └── resources/ │ │ │ ├── module_09_multimodal_features/ # 模組9:多模態特徵工程 │ │ ├── slides/ │ │ ├── notebooks/ │ │ │ ├── 01_text_features/ │ │ │ │ ├── 01_bag_of_words.ipynb # 詞袋模型 │ │ │ │ ├── 02_tfidf.ipynb # TF-IDF特徵 │ │ │ │ ├── 03_word_embeddings.ipynb # 詞嵌入 │ │ │ │ └── 04_imdb_case.ipynb # IMDB影評案例 │ │ │ ├── 02_image_features/ │ │ │ │ ├── 01_color_histograms.ipynb # 顏色直方圖 │ │ │ │ ├── 02_hog_features.ipynb # HOG特徵 │ │ │ │ ├── 03_cnn_features.ipynb # CNN特徵提取 │ │ │ │ └── 04_dogs_cats_case.ipynb # 狗貓圖像案例 │ │ │ └── 03_audio_features/ │ │ │ ├── 01_mfcc_features.ipynb # MFCC特徵 │ │ │ ├── 02_spectral_features.ipynb # 頻譜特徵 │ │ │ └── 03_urban_sound_case.ipynb # 城市聲音案例 │ │ ├── exercises/ │ │ └── resources/ │ │ │ └── module_10_data_mining_applications/ # 模組10:資料探勘應用 │ ├── slides/ │ ├── notebooks/ │ │ ├── 01_association_rules/ │ │ │ ├── 01_apriori_algorithm.ipynb # Apriori演算法 │ │ │ └── 02_instacart_case.ipynb # Instacart購物籃分析 │ │ ├── 02_clustering/ │ │ │ ├── 01_kmeans_clustering.ipynb # K-Means聚類 │ │ │ ├── 02_dbscan_clustering.ipynb # DBSCAN聚類 │ │ │ └── 03_mall_customers_case.ipynb # 購物中心客戶分群 │ │ ├── 03_tree_models/ │ │ │ ├── 01_xgboost_features.ipynb # XGBoost特徵重要性 │ │ │ ├── 02_lightgbm_features.ipynb # LightGBM特徵重要性 │ │ │ └── 03_telco_churn_case.ipynb # 電信客戶流失預測 │ │ └── 04_end_to_end_pipeline.ipynb # 端到端資料探勘流程 │ ├── exercises/ │ └── resources/ │ ├── datasets/ # 資料集存放區 │ ├── raw/ # 原始資料集 │ │ ├── house_prices/ │ │ ├── titanic/ │ │ ├── insurance/ │ │ ├── nyc_taxi/ │ │ ├── breast_cancer/ │ │ ├── power_consumption/ │ │ ├── imdb_reviews/ │ │ ├── dogs_vs_cats/ │ │ ├── urban_sound/ │ │ ├── instacart/ │ │ ├── mall_customers/ │ │ └── telco_churn/ │ │ │ └── processed/ # 預處理後的資料集 │ ├── house_prices/ │ ├── titanic/ │ └── ... │ ├── utils/ # 工具函數 │ ├── data_loader.py # 資料載入工具 │ ├── visualization.py # 視覺化工具 │ ├── preprocessing.py # 預處理工具 │ └── evaluation.py # 評估工具 │ ├── templates/ # 範本檔案 │ ├── notebook_template.ipynb # 筆記本範本 │ └── project_template.ipynb # 專案範本 │ ├── projects/ # 專案作業 │ ├── midterm/ # 期中專案 │ │ ├── requirements.md # 專案需求說明 │ │ ├── evaluation_criteria.md # 評分標準 │ │ └── example_solution/ # 範例解決方案 │ │ │ └── final/ # 期末專案 │ ├── requirements.md # 專案需求說明 │ ├── evaluation_criteria.md # 評分標準 │ └── example_solution/ # 範例解決方案 │ ├── environment/ # 環境設定 │ ├── requirements.txt # Python套件需求 │ ├── environment.yml # Conda環境設定 │ └── docker/ # Docker配置 │ ├── Dockerfile │ └── docker-compose.yml │ ├── docs/ # 文件資料 │ ├── syllabus.md # 課程大綱 │ ├── schedule.md # 課程時間表 │ ├── references.md # 參考資料 │ └── faq.md # 常見問題解答 │ └── README.md # 課程說明文件
本課程資料夾結構設計基於以下原則與考量:
模組化組織:
資料集管理:
工具與範本:
專案導向學習:
環境一致性:
文件完整性:
這種結構設計支援循序漸進的學習過程,從基礎EDA到進階特徵工程,再到實際產業應用案例。每個模組都包含理論講解和實作練習,並提供相關資料集進行操作。此外,工具函數和範本的設計減少了重複工作,讓學生能夠專注於核心概念的學習和應用。
此區為內部記錄區,請在進行每項任務時依序記錄任務目標、規劃步驟、進度更新與反思筆記,確保能夠隨時回顧與調整作業策略。
產品經理 / 業務分析師
系統架構師
開發工程師
測試工程師 / QA
DevOps / 基礎建設工程師
UX/UI 設計師
專案經理
需求分析
系統設計
開發實作
測試驗收
部署上線
維運與改進
分解 (Decomposition)
抽象化 (Abstraction)
模式識別 (Pattern Recognition)
演算法設計 (Algorithm Design)
經驗教訓 (Lessons)
任務與進度管理 (Scratchpad)
自我省思與持續改進
針對全球前 1% 頂尖碼農,但規劃能力較弱的情況,特別制定以下快速 POC 開發 SOP,融合大廠敏捷流程與快速驗證理念:
問題定義與需求確認
技術選型與架構規劃
快速原型 (POC) 開發
測試與反饋驗證
文件紀錄與知識分享
持續迭代與部署準備
版本資訊紀錄
package_versions.md),並在 .cursorrules 中註明參考位置,以便於後續維運與排查。持續更新
pip freeze、npm list 等)定期生成版本清單,並將結果納入版本控制系統。跨團隊協作
版本相依性查詢
常見 AI 開發官方文件網址
本 .cursorrules 文件整合了大廠開發流程、運算思維、快速 POC 開發 SOP、持續學習與自我省思,以及套件與版本管理的全方位守則。所有團隊成員及 AI 輔助開發系統應依據本指引進行工作,並在每次任務中記錄與分享經驗,從而不斷完善流程、提升產品品質與技術水準,同時確保系統依賴資訊的透明性與可追蹤性。