什麼是 StackBlitz?
StackBlitz 是一款專為 JavaScript 生態系統量身打造的基於 Web 的 IDE。它使用由 WebAssembly 支援的 WebContainers 直接在瀏覽器中建立快速的 Node.js 環境。這提供了卓越的速度和安全性。
---
Jina Reader-LM:HTML 到 Markdown 轉換模型
概述:
Jina Reader-LM 是一系列將 HTML 內容轉換為 Markdown 格式的模型,適用於各種內容轉換任務。這些模型在精心挑選的 HTML 和 Markdown 內容對上進行訓練,從而可以有效處理 Web 內容格式轉換。該工具對於需要在不同格式之間切換的內容創作者和開發人員特別有用。
目標用戶:
內容創作者
開發商
任何需要將 HTML 內容轉換為 Markdown 的人
使用案例:
將 Hacker News 網站內容轉換為 Markdown 格式。
將個人部落格 HTML 頁面轉換為 Markdown 以供 GitHub 發布。
將線上文章 HTML 內容變更為 Markdown,以便進行文件和資源組織。
特徵:
支援 HTML 到 Markdown 轉換。
接受過廣泛的 HTML 和 Markdown 內容對的訓練。
無需前綴指令;只需輸入 HTML 即可產生 Markdown。
易於在 Google Colab 中嘗試使用。
本地部署和使用的詳細指南。
針對 Google Colab 免費 T4 GPU 層上的流暢運行進行了最佳化。
可自訂的輸入 URL,用於探索不同的網頁轉換。
教學:
1. 在 Google Colab 中:
- 運行Jina AI提供的Colab筆記本來體驗reader-lm模型。
2. 本地:
- 安裝變壓器庫。
- 使用 AutoTokenizer 和 AutoModelForCausalLM 載入模型。
- 準備 HTML 內容並使用標記器處理。
- 將處理後的輸入文字傳遞給模型以產生 Markdown 內容。
- 列印或儲存產生的Markdown內容。