zulip/zerver/lib/bugdown/fenced_code.py

#!/usr/bin/env python

"""
Fenced Code Extension for Python Markdown
=========================================

This extension adds Fenced Code Blocks to Python-Markdown.

    >>> import markdown
    >>> text = '''
    ... A paragraph before a fenced code block:
    ...
    ... ~~~
    ... Fenced code block
    ... ~~~
    ... '''
    >>> html = markdown.markdown(text, extensions=['fenced_code'])
    >>> print html
    <p>A paragraph before a fenced code block:</p>
    <pre><code>Fenced code block
    </code></pre>

Works with safe_mode also (we check this because we are using the HtmlStash):

    >>> print markdown.markdown(text, extensions=['fenced_code'], safe_mode='replace')
    <p>A paragraph before a fenced code block:</p>
    <pre><code>Fenced code block
    </code></pre>

Include tilde's in a code block and wrap with blank lines:

    >>> text = '''
    ... ~~~~~~~~
    ...
    ... ~~~~
    ... ~~~~~~~~'''
    >>> print markdown.markdown(text, extensions=['fenced_code'])
    <pre><code>
    ~~~~
    </code></pre>

Language tags:

    >>> text = '''
    ... ~~~~{.python}
    ... # Some python code
    ... ~~~~'''
    >>> print markdown.markdown(text, extensions=['fenced_code'])
    <pre><code class="python"># Some python code
    </code></pre>

Copyright 2007-2008 [Waylan Limberg](http://achinghead.com/).

Project website: <http://packages.python.org/Markdown/extensions/fenced_code_blocks.html>
Contact: markdown@freewisdom.org

License: BSD (see ../docs/LICENSE for details)

Dependencies:
* [Python 2.4+](http://python.org)
* [Markdown 2.0+](http://packages.python.org/Markdown/)
* [Pygments (optional)](http://pygments.org)

"""

import re
import markdown
from zerver.lib.bugdown.codehilite import CodeHilite, CodeHiliteExtension

# Global vars
FENCE_RE = re.compile(r'(?P<fence>^(?:~{3,}|`{3,}))[ ]*(\{?\.?(?P<lang>[a-zA-Z0-9_+-]*)\}?)$', re.MULTILINE|re.DOTALL)
FENCED_BLOCK_RE = re.compile( \
    r'(?P<fence>^(?:~{3,}|`{3,}))[ ]*(\{?\.?(?P<lang>[a-zA-Z0-9_+-]*)\}?)?[ ]*\n(?P<code>.*?)(?<=\n)(?P=fence)[ ]*$',
    re.MULTILINE|re.DOTALL
    )
CODE_WRAP = '<pre><code%s>%s</code></pre>'
LANG_TAG = ' class="%s"'

class FencedCodeExtension(markdown.Extension):

    def extendMarkdown(self, md, md_globals):
        """ Add FencedBlockPreprocessor to the Markdown instance. """
        md.registerExtension(self)

        # Newer versions of Python-Markdown (starting at 2.3?) have
        # a normalize_whitespace preprocessor that needs to go first.
        position = ('>normalize_whitespace'
            if 'normalize_whitespace' in md.preprocessors
            else '_begin')

        md.preprocessors.add('fenced_code_block',
                                 FencedBlockPreprocessor(md),
                                 position)


class FencedBlockPreprocessor(markdown.preprocessors.Preprocessor):

    def __init__(self, md):
        markdown.preprocessors.Preprocessor.__init__(self, md)

        self.checked_for_codehilite = False
        self.codehilite_conf = {}

    def format_code(self, lang, text):
        langclass = ''
        if lang:
            langclass = LANG_TAG % (lang,)

        # Check for code hilite extension
        if not self.checked_for_codehilite:
            for ext in self.markdown.registeredExtensions:
                if isinstance(ext, CodeHiliteExtension):
                    self.codehilite_conf = ext.config
                    break

            self.checked_for_codehilite = True

        # If config is not empty, then the codehighlite extension
        # is enabled, so we call it to highlite the code
        if self.codehilite_conf:
            highliter = CodeHilite(text,
                    force_linenos=self.codehilite_conf['force_linenos'][0],
                    guess_lang=self.codehilite_conf['guess_lang'][0],
                    css_class=self.codehilite_conf['css_class'][0],
                    style=self.codehilite_conf['pygments_style'][0],
                    lang=(lang or None),
                    noclasses=self.codehilite_conf['noclasses'][0])

            code = highliter.hilite()
        else:
            code = CODE_WRAP % (langclass, self._escape(text))

        return code

    def format_quote(self, text):
        paragraphs = text.split("\n\n")
        quoted_paragraphs = []
        for paragraph in paragraphs:
            lines = paragraph.split("\n")
            quoted_paragraphs.append("\n".join("> " + line for line in lines if line != ''))
        return "\n\n".join(quoted_paragraphs)

    def placeholder(self, code):
        return self.markdown.htmlStash.store(code, safe=True)

    def format_fence(self, lang, text):
        if lang in ('quote', 'quoted'):
            replacement = self.format_quote(text)
            return replacement
        else:
            code = self.format_code(lang, text)
            return self.placeholder(code)

    def process_fence(self, m, text):
        lang = m.group('lang')
        code = m.group('code')
        fence_text = self.format_fence(lang, code)
        before_text = text[:m.start()]
        end_text = text[m.end():]
        return '%s\n%s\n%s'% (before_text, fence_text, end_text)

    def run(self, lines):
        """ Match and store Fenced Code Blocks in the HtmlStash. """

        text = "\n".join(lines)
        while 1:
            m = FENCED_BLOCK_RE.search(text)
            if m:
                text = self.process_fence(m, text)
            else:
                break


        fence = FENCE_RE.search(text)
        if fence:
            # If we found a starting fence but no ending fence,
            # then we add a closing fence before the two newlines that
            # markdown automatically inserts
            if text[-2:] == '\n\n':
                text = text[:-2] + '\n' + fence.group('fence') + text[-2:]
            else:
                text += fence.group('fence')
            m = FENCED_BLOCK_RE.search(text)
            if m:
                text = self.process_fence(m, text)

        return text.split("\n")

    def _escape(self, txt):
        """ basic html escaping """
        txt = txt.replace('&', '&amp;')
        txt = txt.replace('<', '&lt;')
        txt = txt.replace('>', '&gt;')
        txt = txt.replace('"', '&quot;')
        return txt


def makeExtension(configs=None):
    return FencedCodeExtension(configs=configs)


if __name__ == "__main__":
    import doctest
    doctest.testmod()
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`#!/usr/bin/env python`

			`"""`
			`Fenced Code Extension for Python Markdown`
			`=========================================`

			`This extension adds Fenced Code Blocks to Python-Markdown.`

			`>>> import markdown`
			`>>> text = '''`
			`... A paragraph before a fenced code block:`
			`...`
			`... ~~~`
			`... Fenced code block`
			`... ~~~`
			`... '''`
			`>>> html = markdown.markdown(text, extensions=['fenced_code'])`
			`>>> print html`
			`<p>A paragraph before a fenced code block:</p>`
			`<pre><code>Fenced code block`
			`</code></pre>`

			`Works with safe_mode also (we check this because we are using the HtmlStash):`

			`>>> print markdown.markdown(text, extensions=['fenced_code'], safe_mode='replace')`
			`<p>A paragraph before a fenced code block:</p>`
			`<pre><code>Fenced code block`
			`</code></pre>`

			`Include tilde's in a code block and wrap with blank lines:`

			`>>> text = '''`
			`... ~~~~~~~~`
			`...`
			`... ~~~~`
			`... ~~~~~~~~'''`
			`>>> print markdown.markdown(text, extensions=['fenced_code'])`
			`<pre><code>`
			`~~~~`
			`</code></pre>`

			`Language tags:`

			`>>> text = '''`
			`... ~~~~{.python}`
			`... # Some python code`
			`... ~~~~'''`
			`>>> print markdown.markdown(text, extensions=['fenced_code'])`
			`<pre><code class="python"># Some python code`
			`</code></pre>`

			`Copyright 2007-2008 [Waylan Limberg](http://achinghead.com/).`

			`Project website: <http://packages.python.org/Markdown/extensions/fenced_code_blocks.html>`
			`Contact: markdown@freewisdom.org`

			`License: BSD (see ../docs/LICENSE for details)`

			`Dependencies:`
			`* [Python 2.4+](http://python.org)`
			`* [Markdown 2.0+](http://packages.python.org/Markdown/)`
			`* [Pygments (optional)](http://pygments.org)`

			`"""`

			`import re`
			`import markdown`
[manual] Rename Django app from zephyr to zerver. This needs to be deployed to both staging and prod at the same off-peak time (and the schema migration run). At the time it is deployed, we need to make a few changes directly in the database: (1) UPDATE django_content_type set app_label='zerver' where app_label='zephyr'; (2) UPDATE south_migrationhistory set app_name='zerver' where app_name='zephyr'; (imported from commit eb3fd719571740189514ef0b884738cb30df1320) 2013-07-29 23:03:31 +02:00			`from zerver.lib.bugdown.codehilite import CodeHilite, CodeHiliteExtension`
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00
			`# Global vars`
Enable backtick fenced code blocks. Trac #1900 (imported from commit 47b3a76488a4285641fd1eb3e68bc72047a8d738) 2013-10-15 21:10:38 +02:00			FENCE_RE = re.compile(r'(?P<fence>^(?:~{3,}\|`{3,}))[ ](\{?\.?(?P<lang>[a-zA-Z0-9_+-])\}?)$', re.MULTILINE\|re.DOTALL)
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`FENCED_BLOCK_RE = re.compile( \`
Enable backtick fenced code blocks. Trac #1900 (imported from commit 47b3a76488a4285641fd1eb3e68bc72047a8d738) 2013-10-15 21:10:38 +02:00			r'(?P<fence>^(?:~{3,}\|`{3,}))[ ](\{?\.?(?P<lang>[a-zA-Z0-9_+-])\}?)?[ ]\n(?P<code>.?)(?<=\n)(?P=fence)[ ]*$',
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`re.MULTILINE\|re.DOTALL`
			`)`
			`CODE_WRAP = '<pre><code%s>%s</code></pre>'`
			`LANG_TAG = ' class="%s"'`

			`class FencedCodeExtension(markdown.Extension):`

			`def extendMarkdown(self, md, md_globals):`
			`""" Add FencedBlockPreprocessor to the Markdown instance. """`
			`md.registerExtension(self)`

bugdown: Fix fenced_code for Python-Markdown 2.3 (imported from commit 3954444708e222217407df228f07d2cad402a02b) 2013-04-04 23:14:33 +02:00			`# Newer versions of Python-Markdown (starting at 2.3?) have`
			`# a normalize_whitespace preprocessor that needs to go first.`
			`position = ('>normalize_whitespace'`
			`if 'normalize_whitespace' in md.preprocessors`
			`else '_begin')`

Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`md.preprocessors.add('fenced_code_block',`
			`FencedBlockPreprocessor(md),`
bugdown: Fix fenced_code for Python-Markdown 2.3 (imported from commit 3954444708e222217407df228f07d2cad402a02b) 2013-04-04 23:14:33 +02:00			`position)`
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00

			`class FencedBlockPreprocessor(markdown.preprocessors.Preprocessor):`

			`def __init__(self, md):`
			`markdown.preprocessors.Preprocessor.__init__(self, md)`

			`self.checked_for_codehilite = False`
			`self.codehilite_conf = {}`

Move langclass var into FencedBlockPreprocessor.format_code(). (imported from commit e468a8b6a12494facb0dfa97eff90e02cd14f169) 2013-11-20 19:48:44 +01:00			`def format_code(self, lang, text):`
			`langclass = ''`
			`if lang:`
			`langclass = LANG_TAG % (lang,)`

Extract FencedBlockPreprocessor.format_code(). (imported from commit 3c98b9a7391a71e9c55a7b5c97abd0ee74178b44) 2013-11-20 19:11:07 +01:00			`# Check for code hilite extension`
			`if not self.checked_for_codehilite:`
			`for ext in self.markdown.registeredExtensions:`
			`if isinstance(ext, CodeHiliteExtension):`
			`self.codehilite_conf = ext.config`
			`break`

			`self.checked_for_codehilite = True`

			`# If config is not empty, then the codehighlite extension`
			`# is enabled, so we call it to highlite the code`
			`if self.codehilite_conf:`
			`highliter = CodeHilite(text,`
			`force_linenos=self.codehilite_conf['force_linenos'][0],`
			`guess_lang=self.codehilite_conf['guess_lang'][0],`
			`css_class=self.codehilite_conf['css_class'][0],`
			`style=self.codehilite_conf['pygments_style'][0],`
			`lang=(lang or None),`
			`noclasses=self.codehilite_conf['noclasses'][0])`

			`code = highliter.hilite()`
			`else:`
			`code = CODE_WRAP % (langclass, self._escape(text))`

			`return code`
Refactor fence block code to never infinite loop (imported from commit f72cb182e4fc9c4e8003853276d8aa40b454d08f) 2013-01-29 16:14:30 +01:00
Extract FencedBlockPreprocessor.format_quote(). (imported from commit 59db5415d624402b37ade7fe5547b16f58ae565f) 2013-11-20 19:29:54 +01:00			`def format_quote(self, text):`
			`paragraphs = text.split("\n\n")`
			`quoted_paragraphs = []`
			`for paragraph in paragraphs:`
			`lines = paragraph.split("\n")`
			`quoted_paragraphs.append("\n".join("> " + line for line in lines if line != ''))`
			`return "\n\n".join(quoted_paragraphs)`

Extract FencedBlockPreprocessor.placeholder(). (imported from commit cf6dab74ae97a57498e1e1807c7c4f272f3f448b) 2013-11-20 21:03:57 +01:00			`def placeholder(self, code):`
			`return self.markdown.htmlStash.store(code, safe=True)`

DRY up m.group('code') in FencedBlockPreprocessor. (imported from commit b23caae1ab63a9adb80025b628bc1a7c6a988ce0) 2013-11-20 19:42:18 +01:00			`def format_fence(self, lang, text):`
Simplify FencedBlockPreprocessor.format_fence(). (imported from commit 741f4f0640756d545019b6fe6850af3198b351ba) 2013-11-20 19:47:06 +01:00			`if lang in ('quote', 'quoted'):`
			`replacement = self.format_quote(text)`
			`return replacement`
			`else:`
Move langclass var into FencedBlockPreprocessor.format_code(). (imported from commit e468a8b6a12494facb0dfa97eff90e02cd14f169) 2013-11-20 19:48:44 +01:00			`code = self.format_code(lang, text)`
Extract FencedBlockPreprocessor.placeholder(). (imported from commit cf6dab74ae97a57498e1e1807c7c4f272f3f448b) 2013-11-20 21:03:57 +01:00			`return self.placeholder(code)`
Extract FencedBlockPreprocessor.format_fence(). (imported from commit 8a35de7df9ad956496263c82668b118910edd6b3) 2013-11-20 19:32:21 +01:00
			`def process_fence(self, m, text):`
DRY up m.group('lang') in FencedBlockPreprocessor. (imported from commit 9f9ab5604b7df711a3a369247def1277880b0b5f) 2013-11-20 19:37:02 +01:00			`lang = m.group('lang')`
DRY up m.group('code') in FencedBlockPreprocessor. (imported from commit b23caae1ab63a9adb80025b628bc1a7c6a988ce0) 2013-11-20 19:42:18 +01:00			`code = m.group('code')`
			`fence_text = self.format_fence(lang, code)`
Extract vars in FencedBlockPreprocessor.process_fence(). (imported from commit 092a8e5f7479f1d918219cae058b6a867743c7f9) 2013-11-20 19:53:03 +01:00			`before_text = text[:m.start()]`
			`end_text = text[m.end():]`
			`return '%s\n%s\n%s'% (before_text, fence_text, end_text)`
Refactor fence block code to never infinite loop (imported from commit f72cb182e4fc9c4e8003853276d8aa40b454d08f) 2013-01-29 16:14:30 +01:00
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`def run(self, lines):`
			`""" Match and store Fenced Code Blocks in the HtmlStash. """`

			`text = "\n".join(lines)`
			`while 1:`
			`m = FENCED_BLOCK_RE.search(text)`
Refactor fence block code to never infinite loop (imported from commit f72cb182e4fc9c4e8003853276d8aa40b454d08f) 2013-01-29 16:14:30 +01:00			`if m:`
			`text = self.process_fence(m, text)`
			`else:`
			`break`

Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00
Fix code block auto-closing. Trac #1162 The process_fence method replaces code blocks with placeholders, so indexes stored before the replacement are incorrect. However, because the closed code blocks have been replaced, we can simply search the whole string for any remaining opening code block markers. (imported from commit 6a9e6924840f8f3ca5175da7c52a905e27c1fabd) 2013-10-15 21:14:51 +02:00			`fence = FENCE_RE.search(text)`
Refactor fence block code to never infinite loop (imported from commit f72cb182e4fc9c4e8003853276d8aa40b454d08f) 2013-01-29 16:14:30 +01:00			`if fence:`
			`# If we found a starting fence but no ending fence,`
			`# then we add a closing fence before the two newlines that`
			`# markdown automatically inserts`
			`if text[-2:] == '\n\n':`
			`text = text[:-2] + '\n' + fence.group('fence') + text[-2:]`
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`else:`
Refactor fence block code to never infinite loop (imported from commit f72cb182e4fc9c4e8003853276d8aa40b454d08f) 2013-01-29 16:14:30 +01:00			`text += fence.group('fence')`
			`m = FENCED_BLOCK_RE.search(text)`
			`if m:`
			`text = self.process_fence(m, text)`
Automatically add an end-of-code fence block if missing (imported from commit 167f0217bbe6709e73dbc06f2894d9e22ee17a77) 2013-01-24 20:20:00 +01:00
Import GitHub version of Markdown fenced_code extension (imported from commit 929de2ba09a5c6dabed20c7f1b3ba319ba42b244) 2012-11-19 17:55:28 +01:00			`return text.split("\n")`

			`def _escape(self, txt):`
			`""" basic html escaping """`
			`txt = txt.replace('&', '&')`
			`txt = txt.replace('<', '<')`
			`txt = txt.replace('>', '>')`
			`txt = txt.replace('"', '"')`
			`return txt`


			`def makeExtension(configs=None):`
			`return FencedCodeExtension(configs=configs)`


			`if __name__ == "__main__":`
			`import doctest`
			`doctest.testmod()`