Pandoc có thể chuyển đổi HTML sang Markdown không?

Các gói

html_page <- readLines("../../static/files/example.html")
7 và
html_page <- readLines("../../static/files/example.html")
8 được sử dụng cùng với pandoc để chuyển đổi mã R và số liệu sang nhiều định dạng bao gồm PDF và từ. Ở đây, tôi đang khám phá cách chuyển đổi HTML trở lại định dạng markdown. Bài đăng này xuất hiện khi tôi đang tìm cách chuyển đổi XML thành markdown, điều mà tôi vẫn chưa tìm được cách dễ dàng để thực hiện. Pandoc không phải là cách duy nhất để chuyển đổi HTML thành markdown (xem từ chối, html2text)

Pandoc được đóng gói trong RStudio và trên Windows, các tệp thực thi được đặt trong

html_page <- readLines("../../static/files/example.html")
9. Gói
html_page <- readLines("../../static/files/example.html")
8 chứa các hàm bao bọc để sử dụng pandoc trong RStudio

Ở đây, tôi đang cố gắng chuyển đổi trang HTML ví dụ này trở lại đánh dấu bằng cách sử dụng chức năng

html_page <- readLines("../../static/files/example.html")
0. Đầu tiên,
html_page <- readLines("../../static/files/example.html")
0 yêu cầu một tệp thực tế, điều đó có nghĩa là nó không chấp nhận chuỗi mã HTML được trích dẫn trong đối số
html_page <- readLines("../../static/files/example.html")
2 của nó

Html ví dụ




Enter a title, displayed at the top of the window.



Enter the main heading, usually the same as the title.

Be bold in stating your key points. Put them in a list:

  • The first item in your list
  • The second item; italicize key words

Improve your image by including an image.

Pandoc có thể chuyển đổi HTML sang Markdown không?

Add a link to your favorite Web site. Break up your page with a horizontal rule or two.


Finally, link to another page in your own Web site.

© Wiley Publishing, 2011

Tôi đã lưu ví dụ HTML ở đây là

html_page <- readLines("../../static/files/example.html")
3

html_page <- readLines("../../static/files/example.html")

Chúng ta có thể in đối tượng trong R

cat(html_page)
##    Enter a title, displayed at the top of the window.    

Enter the main heading, usually the same as the title.

Be bold in stating your key points. Put them in a list:

  • The first item in your list
  • The second item; italicize key words

Improve your image by including an image.

Pandoc có thể chuyển đổi HTML sang Markdown không?

Add a link to your favorite Web site. Break up your page with a horizontal rule or two.


Finally, link to another page in your own Web site.

© Wiley Publishing, 2011

html_page <- readLines("../../static/files/example.html")
4 có thể chuyển đổi giữa nhiều định dạng khác nhau và để đánh dấu, nó có nhiều biến thể bao gồm biến thể có hương vị github (dành cho Github) và php markdown bổ sung (biến thể được sử dụng bởi các trang web WordPress)

Biến thể an toàn nhất để chọn là ________ 05 là biến thể gốc của ________ 06

Pandoc yêu cầu đường dẫn tệp trong trường hợp của tôi, nằm trong một thư mục khác chứ không phải thư mục làm việc của tôi

html_page <- readLines("../../static/files/example.html")
0

Lưu ý rằng tiêu đề 1 được định dạng bằng

html_page <- readLines("../../static/files/example.html")
7 thay vì
html_page <- readLines("../../static/files/example.html")
8 mà RMarkdown có vẻ ưu tiên. Chúng tôi có thể yêu cầu pandoc sử dụng
html_page <- readLines("../../static/files/example.html")
8 trong quá trình chuyển đổi bằng cách thêm một đối số

html_page <- readLines("../../static/files/example.html")
4

Ngay bây giờ, đầu ra đang được chuyển đến bàn điều khiển. Thay vào đó, một tệp có thể được tạo bằng

html_page <- readLines("../../static/files/example.html")
5

Pandoc có vô số tiện ích mở rộng kiểu dáng cho các biến thể đánh dấu, tất cả được liệt kê trên trang hướng dẫn

Pandoc bỏ qua mọi thứ kèm theo trong

cat(html_page)
##    Enter a title, displayed at the top of the window.    

Enter the main heading, usually the same as the title.

Be bold in stating your key points. Put them in a list:

  • The first item in your list
  • The second item; italicize key words

Improve your image by including an image.

Pandoc có thể chuyển đổi HTML sang Markdown không?

Add a link to your favorite Web site. Break up your page with a horizontal rule or two.


Finally, link to another page in your own Web site.

© Wiley Publishing, 2011

0. Khi chuyển đổi từ markdown sang HTML, những nhận xét này thường được đặt trực tiếp như trong tài liệu HTML nhưng điều ngược lại dường như không đúng

Tôi có thể chuyển đổi HTML sang Markdown không?

Chúng tôi có thể dễ dàng chuyển đổi HTML thành markdown bằng cách sử dụng gói markdownify .

Pandoc có thể chuyển đổi PDF sang Markdown không?

Bạn có thể sử dụng chương trình pandoc trên các máy SCF Linux và Mac (thông qua cửa sổ đầu cuối) để chuyển đổi từ các định dạng như HTML, LaTeX và Markdown sang các định dạng như HTML, LaTeX, Word, OpenOffice và PDF, cùng các định dạng khác. Xem trang hướng dẫn của pandoc hoặc trang web Pandoc để biết thêm chi tiết

Làm cách nào để chuyển đổi HTML sang RMD trên RStudio?

Bạn có thể nhận được kết quả 98% bằng cách. .
Mở tệp rmarkdown mới (trong RStudio v 1. 4+),
Nhấp vào nút "Chuyển sang trình chỉnh sửa đánh dấu trực quan"*,
Chọn và sao chép đầu ra html từ trình duyệt
Dán vào tập tin rmarkdown của bạn

Pandoc có thể chuyển đổi từ PDF không?