refactor: Export non-markdown logic in mention.py.

2021-06-12 22:51:30 +00:00 · 2021-06-12 22:51:30 +00:00 · c507931ac8
parent a9320accdc
commit c507931ac8
8 changed files with 155 additions and 153 deletions
--- a/zerver/lib/actions.py
+++ b/zerver/lib/actions.py
@ -96,8 +96,9 @@ from zerver.lib.export import get_realm_exports_serialized
 from zerver.lib.external_accounts import DEFAULT_EXTERNAL_ACCOUNTS
 from zerver.lib.hotspots import get_next_hotspots
 from zerver.lib.i18n import get_language_name
-from zerver.lib.markdown import MentionData, topic_links
+from zerver.lib.markdown import topic_links
 from zerver.lib.markdown import version as markdown_version
 from zerver.lib.mention import MentionData
 from zerver.lib.message import (
    MessageDict,
    SendMessageRequest,
--- a/zerver/lib/markdown/init.py
+++ b/zerver/lib/markdown/init.py
@ -1,14 +1,13 @@
 # Zulip's main Markdown implementation.  See docs/subsystems/markdown.md for
 # detailed documentation on our Markdown syntax.
 import datetime
 import functools
 import html
 import logging
 import re
 import time
 import urllib
 import urllib.parse
-from collections import defaultdict, deque
+from collections import deque
 from dataclasses import dataclass
 from typing import (
    Any,
@ -39,7 +38,6 @@ import markdown.treeprocessors
 import markdown.util
 import requests
 from django.conf import settings
 from django.db.models import Q
 from markdown.blockparser import BlockParser
 from markdown.extensions import codehilite, nl2br, sane_lists, tables
 from tlds import tld_set
@ -52,7 +50,7 @@ from zerver.lib.emoji import EMOTICON_RE, codepoint_to_name, name_to_codepoint,
 from zerver.lib.exceptions import MarkdownRenderingException
 from zerver.lib.markdown import fenced_code
 from zerver.lib.markdown.fenced_code import FENCE_RE
-from zerver.lib.mention import possible_mentions, possible_user_group_mentions
+from zerver.lib.mention import MentionData, get_stream_name_info
 from zerver.lib.subdomains import is_static_or_current_realm_url
 from zerver.lib.tex import render_tex
 from zerver.lib.thumbnail import user_uploads_or_external
@ -61,15 +59,7 @@ from zerver.lib.timezone import common_timezones
 from zerver.lib.types import LinkifierDict
 from zerver.lib.url_encoding import encode_stream, hash_util_encode
 from zerver.lib.url_preview import preview as link_preview
-from zerver.models import (
+from zerver.models import Message, Realm, linkifiers_for_realm
    Message,
    Realm,
    UserGroup,
    UserGroupMembership,
    UserProfile,
    get_active_streams,
    linkifiers_for_realm,
 )
 ReturnT = TypeVar("ReturnT")
@ -92,12 +82,6 @@ def one_time(method: Callable[[], ReturnT]) -> Callable[[], ReturnT]:
    return cache_wrapper
 class FullNameInfo(TypedDict):
    id: int
    email: str
    full_name: str
 class LinkInfo(TypedDict):
    parent: Element
    title: Optional[str]
@ -2393,132 +2377,6 @@ def privacy_clean_markdown(content: str) -> str:
    return repr(_privacy_re.sub("x", content))
 def get_possible_mentions_info(realm_id: int, mention_texts: Set[str]) -> List[FullNameInfo]:
    if not mention_texts:
        return []
    q_list = set()
    name_re = r"(?P<full_name>.+)?\|(?P<mention_id>\d+)$"
    for mention_text in mention_texts:
        name_syntax_match = re.match(name_re, mention_text)
        if name_syntax_match:
            full_name = name_syntax_match.group("full_name")
            mention_id = name_syntax_match.group("mention_id")
            if full_name:
                # For **name|id** mentions as mention_id
                # cannot be null inside this block.
                q_list.add(Q(full_name__iexact=full_name, id=mention_id))
            else:
                # For **|id** syntax.
                q_list.add(Q(id=mention_id))
        else:
            # For **name** syntax.
            q_list.add(Q(full_name__iexact=mention_text))
    rows = (
        UserProfile.objects.filter(
            realm_id=realm_id,
            is_active=True,
        )
        .filter(
            functools.reduce(lambda a, b: a | b, q_list),
        )
        .values(
            "id",
            "full_name",
            "email",
        )
    )
    return list(rows)
 class MentionData:
    def __init__(self, realm_id: int, content: str) -> None:
        mention_texts, has_wildcards = possible_mentions(content)
        possible_mentions_info = get_possible_mentions_info(realm_id, mention_texts)
        self.full_name_info = {row["full_name"].lower(): row for row in possible_mentions_info}
        self.user_id_info = {row["id"]: row for row in possible_mentions_info}
        self.init_user_group_data(realm_id=realm_id, content=content)
        self.has_wildcards = has_wildcards
    def message_has_wildcards(self) -> bool:
        return self.has_wildcards
    def init_user_group_data(self, realm_id: int, content: str) -> None:
        user_group_names = possible_user_group_mentions(content)
        self.user_group_name_info = get_user_group_name_info(realm_id, user_group_names)
        self.user_group_members: Dict[int, List[int]] = defaultdict(list)
        group_ids = [group.id for group in self.user_group_name_info.values()]
        if not group_ids:
            # Early-return to avoid the cost of hitting the ORM,
            # which shows up in profiles.
            return
        membership = UserGroupMembership.objects.filter(user_group_id__in=group_ids)
        for info in membership.values("user_group_id", "user_profile_id"):
            group_id = info["user_group_id"]
            user_profile_id = info["user_profile_id"]
            self.user_group_members[group_id].append(user_profile_id)
    def get_user_by_name(self, name: str) -> Optional[FullNameInfo]:
        # warning: get_user_by_name is not dependable if two
        # users of the same full name are mentioned. Use
        # get_user_by_id where possible.
        return self.full_name_info.get(name.lower(), None)
    def get_user_by_id(self, id: int) -> Optional[FullNameInfo]:
        return self.user_id_info.get(id, None)
    def get_user_ids(self) -> Set[int]:
        """
        Returns the user IDs that might have been mentioned by this
        content.  Note that because this data structure has not parsed
        the message and does not know about escaping/code blocks, this
        will overestimate the list of user ids.
        """
        return set(self.user_id_info.keys())
    def get_user_group(self, name: str) -> Optional[UserGroup]:
        return self.user_group_name_info.get(name.lower(), None)
    def get_group_members(self, user_group_id: int) -> List[int]:
        return self.user_group_members.get(user_group_id, [])
 def get_user_group_name_info(realm_id: int, user_group_names: Set[str]) -> Dict[str, UserGroup]:
    if not user_group_names:
        return {}
    rows = UserGroup.objects.filter(realm_id=realm_id, name__in=user_group_names)
    dct = {row.name.lower(): row for row in rows}
    return dct
 def get_stream_name_info(realm: Realm, stream_names: Set[str]) -> Dict[str, FullNameInfo]:
    if not stream_names:
        return {}
    q_list = {Q(name=name) for name in stream_names}
    rows = (
        get_active_streams(
            realm=realm,
        )
        .filter(
            functools.reduce(lambda a, b: a | b, q_list),
        )
        .values(
            "id",
            "name",
        )
    )
    dct = {row["name"]: row for row in rows}
    return dct
 def do_convert(
    content: str,
    realm_alert_words_automaton: Optional[ahocorasick.Automaton] = None,
--- a/zerver/lib/mention.py
+++ b/zerver/lib/mention.py
@ -1,5 +1,12 @@
 import functools
 import re
-from typing import Match, Optional, Set, Tuple
+from collections import defaultdict
 from typing import Dict, List, Match, Optional, Set, Tuple
 from django.db.models import Q
 from zerver.lib.types import FullNameInfo
 from zerver.models import Realm, UserGroup, UserGroupMembership, UserProfile, get_active_streams
 # Match multi-word string between @** ** or match any one-word
 # sequences after @
@ -35,3 +42,129 @@ def possible_mentions(content: str) -> Tuple[Set[str], bool]:
 def possible_user_group_mentions(content: str) -> Set[str]:
    return {m.group("match") for m in USER_GROUP_MENTIONS_RE.finditer(content)}
 def get_possible_mentions_info(realm_id: int, mention_texts: Set[str]) -> List[FullNameInfo]:
    if not mention_texts:
        return []
    q_list = set()
    name_re = r"(?P<full_name>.+)?\|(?P<mention_id>\d+)$"
    for mention_text in mention_texts:
        name_syntax_match = re.match(name_re, mention_text)
        if name_syntax_match:
            full_name = name_syntax_match.group("full_name")
            mention_id = name_syntax_match.group("mention_id")
            if full_name:
                # For **name|id** mentions as mention_id
                # cannot be null inside this block.
                q_list.add(Q(full_name__iexact=full_name, id=mention_id))
            else:
                # For **|id** syntax.
                q_list.add(Q(id=mention_id))
        else:
            # For **name** syntax.
            q_list.add(Q(full_name__iexact=mention_text))
    rows = (
        UserProfile.objects.filter(
            realm_id=realm_id,
            is_active=True,
        )
        .filter(
            functools.reduce(lambda a, b: a | b, q_list),
        )
        .values(
            "id",
            "full_name",
            "email",
        )
    )
    return list(rows)
 def get_user_group_name_info(realm_id: int, user_group_names: Set[str]) -> Dict[str, UserGroup]:
    if not user_group_names:
        return {}
    rows = UserGroup.objects.filter(realm_id=realm_id, name__in=user_group_names)
    dct = {row.name.lower(): row for row in rows}
    return dct
 class MentionData:
    def __init__(self, realm_id: int, content: str) -> None:
        mention_texts, has_wildcards = possible_mentions(content)
        possible_mentions_info = get_possible_mentions_info(realm_id, mention_texts)
        self.full_name_info = {row["full_name"].lower(): row for row in possible_mentions_info}
        self.user_id_info = {row["id"]: row for row in possible_mentions_info}
        self.init_user_group_data(realm_id=realm_id, content=content)
        self.has_wildcards = has_wildcards
    def message_has_wildcards(self) -> bool:
        return self.has_wildcards
    def init_user_group_data(self, realm_id: int, content: str) -> None:
        user_group_names = possible_user_group_mentions(content)
        self.user_group_name_info = get_user_group_name_info(realm_id, user_group_names)
        self.user_group_members: Dict[int, List[int]] = defaultdict(list)
        group_ids = [group.id for group in self.user_group_name_info.values()]
        if not group_ids:
            # Early-return to avoid the cost of hitting the ORM,
            # which shows up in profiles.
            return
        membership = UserGroupMembership.objects.filter(user_group_id__in=group_ids)
        for info in membership.values("user_group_id", "user_profile_id"):
            group_id = info["user_group_id"]
            user_profile_id = info["user_profile_id"]
            self.user_group_members[group_id].append(user_profile_id)
    def get_user_by_name(self, name: str) -> Optional[FullNameInfo]:
        # warning: get_user_by_name is not dependable if two
        # users of the same full name are mentioned. Use
        # get_user_by_id where possible.
        return self.full_name_info.get(name.lower(), None)
    def get_user_by_id(self, id: int) -> Optional[FullNameInfo]:
        return self.user_id_info.get(id, None)
    def get_user_ids(self) -> Set[int]:
        """
        Returns the user IDs that might have been mentioned by this
        content.  Note that because this data structure has not parsed
        the message and does not know about escaping/code blocks, this
        will overestimate the list of user ids.
        """
        return set(self.user_id_info.keys())
    def get_user_group(self, name: str) -> Optional[UserGroup]:
        return self.user_group_name_info.get(name.lower(), None)
    def get_group_members(self, user_group_id: int) -> List[int]:
        return self.user_group_members.get(user_group_id, [])
 def get_stream_name_info(realm: Realm, stream_names: Set[str]) -> Dict[str, FullNameInfo]:
    if not stream_names:
        return {}
    q_list = {Q(name=name) for name in stream_names}
    rows = (
        get_active_streams(
            realm=realm,
        )
        .filter(
            functools.reduce(lambda a, b: a | b, q_list),
        )
        .values(
            "id",
            "name",
        )
    )
    dct = {row["name"]: row for row in rows}
    return dct
--- a/zerver/lib/message.py
+++ b/zerver/lib/message.py
@ -27,8 +27,9 @@ from zerver.lib.display_recipient import (
    UserDisplayRecipient,
    bulk_fetch_display_recipients,
 )
-from zerver.lib.markdown import MentionData, markdown_convert, topic_links
+from zerver.lib.markdown import markdown_convert, topic_links
 from zerver.lib.markdown import version as markdown_version
 from zerver.lib.mention import MentionData
 from zerver.lib.request import JsonableError
 from zerver.lib.stream_subscription import (
    get_stream_subscriptions_for_user,
--- a/zerver/lib/types.py
+++ b/zerver/lib/types.py
@ -68,3 +68,9 @@ class SAMLIdPConfigDict(TypedDict, total=False):
    extra_attrs: List[str]
    x509cert: str
    x509cert_path: str
 class FullNameInfo(TypedDict):
    id: int
    email: str
    full_name: str
--- a/zerver/tests/test_events.py
+++ b/zerver/tests/test_events.py
@ -167,7 +167,7 @@ from zerver.lib.events import (
    fetch_initial_state_data,
    post_process_state,
 )
-from zerver.lib.markdown import MentionData
+from zerver.lib.mention import MentionData
 from zerver.lib.message import render_markdown
 from zerver.lib.test_classes import ZulipTestCase
 from zerver.lib.test_helpers import (
--- a/zerver/tests/test_markdown.py
+++ b/zerver/tests/test_markdown.py
@ -25,11 +25,9 @@ from zerver.lib.emoji import get_emoji_url
 from zerver.lib.exceptions import MarkdownRenderingException
 from zerver.lib.markdown import (
    MarkdownListPreprocessor,
    MentionData,
    clear_state_for_testing,
    content_has_emoji_syntax,
    fetch_tweet_data,
    get_possible_mentions_info,
    get_tweet_id,
    image_preview_enabled,
    markdown_convert,
@ -41,7 +39,12 @@ from zerver.lib.markdown import (
 )
 from zerver.lib.markdown.fenced_code import FencedBlockPreprocessor
 from zerver.lib.mdiff import diff_strings
-from zerver.lib.mention import possible_mentions, possible_user_group_mentions
+from zerver.lib.mention import (
    MentionData,
    get_possible_mentions_info,
    possible_mentions,
    possible_user_group_mentions,
 )
 from zerver.lib.message import render_markdown
 from zerver.lib.request import JsonableError
 from zerver.lib.test_classes import ZulipTestCase
--- a/zerver/tests/test_message_fetch.py
+++ b/zerver/tests/test_message_fetch.py
@ -20,7 +20,7 @@ from zerver.lib.actions import (
    do_update_message,
 )
 from zerver.lib.avatar import avatar_url
-from zerver.lib.markdown import MentionData
+from zerver.lib.mention import MentionData
 from zerver.lib.message import (
    MessageDict,
    get_first_visible_message_id,