message: Split MessageDict and friends into its own file.

(cherry picked from commit 93a071a1f8)
2023-10-03 01:25:57 +00:00 · 2023-10-03 01:25:57 +00:00 · e15a175a42
parent 4c1b1ae2f6
commit e15a175a42
15 changed files with 593 additions and 593 deletions
--- a/zerver/actions/message_edit.py
+++ b/zerver/actions/message_edit.py
@ -39,8 +39,8 @@ from zerver.lib.message import (
    stream_wildcard_mention_allowed,
    topic_wildcard_mention_allowed,
    truncate_topic,
-    update_to_dict_cache,
 )
+from zerver.lib.message_cache import update_to_dict_cache
 from zerver.lib.queue import queue_json_publish
 from zerver.lib.stream_subscription import get_active_subscriptions_for_stream_id
 from zerver.lib.stream_topic import StreamTopicTarget
--- a/zerver/actions/message_send.py
+++ b/zerver/actions/message_send.py
@ -51,7 +51,6 @@ from zerver.lib.markdown import MessageRenderingResult, render_message_markdown
 from zerver.lib.markdown import version as markdown_version
 from zerver.lib.mention import MentionBackend, MentionData
 from zerver.lib.message import (
-    MessageDict,
    SendMessageRequest,
    check_user_group_mention_allowed,
    normalize_body,
@ -61,6 +60,7 @@ from zerver.lib.message import (
    truncate_topic,
    visibility_policy_for_send_message,
 )
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.muted_users import get_muting_users
 from zerver.lib.notification_data import (
    UserMessageNotificationsData,
--- a/zerver/actions/reactions.py
+++ b/zerver/actions/reactions.py
@ -8,9 +8,9 @@ from zerver.lib.message import (
    access_message,
    set_visibility_policy_possible,
    should_change_visibility_policy,
-    update_to_dict_cache,
    visibility_policy_for_participation,
 )
+from zerver.lib.message_cache import update_to_dict_cache
 from zerver.lib.stream_subscription import subscriber_ids_with_stream_history_access
 from zerver.lib.streams import access_stream_by_id
 from zerver.models import Message, Reaction, Recipient, Stream, UserMessage, UserProfile
--- a/zerver/lib/message.py
+++ b/zerver/lib/message.py
@ -1,8 +1,5 @@
-import copy
-import zlib
 from dataclasses import dataclass, field
 from datetime import datetime, timedelta
-from email.headerregistry import Address
 from typing import (
    Any,
    Collection,
@ -17,7 +14,6 @@ from typing import (
    Union,
 )

-import orjson
 from django.conf import settings
 from django.db import connection
 from django.db.models import Exists, Max, OuterRef, QuerySet, Sum
@ -28,20 +24,12 @@ from psycopg2.sql import SQL

 from analytics.lib.counts import COUNT_STATS
 from analytics.models import RealmCount
-from zerver.lib.avatar import get_avatar_field, get_avatar_for_inaccessible_user
-from zerver.lib.cache import (
-    cache_set_many,
-    cache_with_key,
-    generic_bulk_cached_fetch,
-    to_dict_cache_key,
-    to_dict_cache_key_id,
-)
-from zerver.lib.display_recipient import bulk_fetch_display_recipients, get_display_recipient_by_id
+from zerver.lib.cache import generic_bulk_cached_fetch, to_dict_cache_key_id
+from zerver.lib.display_recipient import get_display_recipient_by_id
 from zerver.lib.exceptions import JsonableError, MissingAuthenticationError
-from zerver.lib.markdown import MessageRenderingResult, render_message_markdown, topic_links
-from zerver.lib.markdown import version as markdown_version
+from zerver.lib.markdown import MessageRenderingResult
 from zerver.lib.mention import MentionData
-from zerver.lib.query_helpers import query_for_ids
+from zerver.lib.message_cache import MessageDict, extract_message_dict, stringify_message_dict
 from zerver.lib.request import RequestVariableConversionError
 from zerver.lib.stream_subscription import (
    get_stream_subscriptions_for_user,
@ -49,25 +37,16 @@ from zerver.lib.stream_subscription import (
    num_subscribers_for_stream_id,
 )
 from zerver.lib.streams import can_access_stream_history, get_web_public_streams_queryset
-from zerver.lib.timestamp import datetime_to_timestamp
-from zerver.lib.topic import (
-    DB_TOPIC_NAME,
-    MESSAGE__TOPIC,
-    TOPIC_LINKS,
-    TOPIC_NAME,
-    messages_for_topic,
-)
-from zerver.lib.types import DisplayRecipientT, EditHistoryEvent, UserDisplayRecipient
+from zerver.lib.topic import MESSAGE__TOPIC, TOPIC_NAME, messages_for_topic
+from zerver.lib.types import UserDisplayRecipient
 from zerver.lib.user_groups import is_user_in_group
 from zerver.lib.user_topics import build_get_topic_visibility_policy, get_topic_visibility_policy
 from zerver.lib.users import get_inaccessible_user_ids
 from zerver.models import (
    Message,
-    Reaction,
    Realm,
    Recipient,
    Stream,
-    SubMessage,
    Subscription,
    UserGroup,
    UserMessage,
@ -77,7 +56,6 @@ from zerver.models import (
 from zerver.models.constants import MAX_TOPIC_NAME_LENGTH
 from zerver.models.groups import SystemGroups
 from zerver.models.messages import get_usermessage_by_message_id
-from zerver.models.realms import get_fake_email_domain
 from zerver.models.users import is_cross_realm_bot_email


@ -90,16 +68,6 @@ class MessageDetailsDict(TypedDict, total=False):
    unmuted_stream_msg: bool


-class RawReactionRow(TypedDict):
-    emoji_code: str
-    emoji_name: str
-    message_id: int
-    reaction_type: str
-    user_profile__email: str
-    user_profile__full_name: str
-    user_profile_id: int
-
-
 class RawUnreadStreamDict(TypedDict):
    stream_id: int
    topic: str
@ -293,530 +261,6 @@ def messages_for_ids(
    return message_list


-def sew_messages_and_reactions(
-    messages: List[Dict[str, Any]], reactions: List[Dict[str, Any]]
-) -> List[Dict[str, Any]]:
-    """Given a iterable of messages and reactions stitch reactions
-    into messages.
-    """
-    # Add all messages with empty reaction item
-    for message in messages:
-        message["reactions"] = []
-
-    # Convert list of messages into dictionary to make reaction stitching easy
-    converted_messages = {message["id"]: message for message in messages}
-
-    for reaction in reactions:
-        converted_messages[reaction["message_id"]]["reactions"].append(reaction)
-
-    return list(converted_messages.values())
-
-
-def sew_messages_and_submessages(
-    messages: List[Dict[str, Any]], submessages: List[Dict[str, Any]]
-) -> None:
-    # This is super similar to sew_messages_and_reactions.
-    for message in messages:
-        message["submessages"] = []
-
-    message_dict = {message["id"]: message for message in messages}
-
-    for submessage in submessages:
-        message_id = submessage["message_id"]
-        if message_id in message_dict:
-            message = message_dict[message_id]
-            message["submessages"].append(submessage)
-
-
-def extract_message_dict(message_bytes: bytes) -> Dict[str, Any]:
-    return orjson.loads(zlib.decompress(message_bytes))
-
-
-def stringify_message_dict(message_dict: Dict[str, Any]) -> bytes:
-    return zlib.compress(orjson.dumps(message_dict))
-
-
-@cache_with_key(to_dict_cache_key, timeout=3600 * 24)
-def message_to_dict_json(message: Message, realm_id: Optional[int] = None) -> bytes:
-    return MessageDict.to_dict_uncached([message], realm_id)[message.id]
-
-
-def save_message_rendered_content(message: Message, content: str) -> str:
-    rendering_result = render_message_markdown(message, content, realm=message.get_realm())
-    rendered_content = None
-    if rendering_result is not None:
-        rendered_content = rendering_result.rendered_content
-    message.rendered_content = rendered_content
-    message.rendered_content_version = markdown_version
-    message.save_rendered_content()
-    return rendered_content
-
-
-class MessageDict:
-    """MessageDict is the core class responsible for marshalling Message
-    objects obtained from the database into a format that can be sent
-    to clients via the Zulip API, whether via `GET /messages`,
-    outgoing webhooks, or other code paths.  There are two core flows through
-    which this class is used:
-
-    * For just-sent messages, we construct a single `wide_dict` object
-      containing all the data for the message and the related
-      UserProfile models (sender_info and recipient_info); this object
-      can be stored in queues, caches, etc., and then later turned
-      into an API-format JSONable dictionary via finalize_payload.
-
-    * When fetching messages from the database, we fetch their data in
-      bulk using messages_for_ids, which makes use of caching, bulk
-      fetches that skip the Django ORM, etc., to provide an optimized
-      interface for fetching hundreds of thousands of messages from
-      the database and then turning them into API-format JSON
-      dictionaries.
-
-    """
-
-    @staticmethod
-    def wide_dict(message: Message, realm_id: Optional[int] = None) -> Dict[str, Any]:
-        """
-        The next two lines get the cacheable field related
-        to our message object, with the side effect of
-        populating the cache.
-        """
-        json = message_to_dict_json(message, realm_id)
-        obj = extract_message_dict(json)
-
-        """
-        The steps below are similar to what we do in
-        post_process_dicts(), except we don't call finalize_payload(),
-        since that step happens later in the queue
-        processor.
-        """
-        MessageDict.bulk_hydrate_sender_info([obj])
-        MessageDict.bulk_hydrate_recipient_info([obj])
-
-        return obj
-
-    @staticmethod
-    def post_process_dicts(
-        objs: List[Dict[str, Any]],
-        apply_markdown: bool,
-        client_gravatar: bool,
-        realm: Realm,
-    ) -> None:
-        """
-        NOTE: This function mutates the objects in
-              the `objs` list, rather than making
-              shallow copies.  It might be safer to
-              make shallow copies here, but performance
-              is somewhat important here, as we are
-              often fetching hundreds of messages.
-        """
-        MessageDict.bulk_hydrate_sender_info(objs)
-        MessageDict.bulk_hydrate_recipient_info(objs)
-
-        for obj in objs:
-            can_access_sender = obj.get("can_access_sender", True)
-            MessageDict.finalize_payload(
-                obj,
-                apply_markdown,
-                client_gravatar,
-                skip_copy=True,
-                can_access_sender=can_access_sender,
-                realm_host=realm.host,
-            )
-
-    @staticmethod
-    def finalize_payload(
-        obj: Dict[str, Any],
-        apply_markdown: bool,
-        client_gravatar: bool,
-        keep_rendered_content: bool = False,
-        skip_copy: bool = False,
-        can_access_sender: bool = True,
-        realm_host: str = "",
-    ) -> Dict[str, Any]:
-        """
-        By default, we make a shallow copy of the incoming dict to avoid
-        mutation-related bugs.  Code paths that are passing a unique object
-        can pass skip_copy=True to avoid this extra work.
-        """
-        if not skip_copy:
-            obj = copy.copy(obj)
-
-        if obj["sender_email_address_visibility"] != UserProfile.EMAIL_ADDRESS_VISIBILITY_EVERYONE:
-            # If email address of the sender is only available to administrators,
-            # clients cannot compute gravatars, so we force-set it to false.
-            # If we plumbed the current user's role, we could allow client_gravatar=True
-            # here if the current user's role has access to the target user's email address.
-            client_gravatar = False
-
-        if not can_access_sender:
-            # Enforce inability to access details of inaccessible
-            # users. We should be able to remove the realm_host and
-            # can_access_user plumbing to this function if/when we
-            # shift the Zulip API to not send these denormalized
-            # fields about message senders favor of just sending the
-            # sender's user ID.
-            obj["sender_full_name"] = str(UserProfile.INACCESSIBLE_USER_NAME)
-            sender_id = obj["sender_id"]
-            obj["sender_email"] = Address(
-                username=f"user{sender_id}", domain=get_fake_email_domain(realm_host)
-            ).addr_spec
-
-        MessageDict.set_sender_avatar(obj, client_gravatar, can_access_sender)
-        if apply_markdown:
-            obj["content_type"] = "text/html"
-            obj["content"] = obj["rendered_content"]
-        else:
-            obj["content_type"] = "text/x-markdown"
-
-        if not keep_rendered_content:
-            del obj["rendered_content"]
-        del obj["sender_realm_id"]
-        del obj["sender_avatar_source"]
-        del obj["sender_delivery_email"]
-        del obj["sender_avatar_version"]
-
-        del obj["recipient_type"]
-        del obj["recipient_type_id"]
-        del obj["sender_is_mirror_dummy"]
-        del obj["sender_email_address_visibility"]
-        if "can_access_sender" in obj:
-            del obj["can_access_sender"]
-        return obj
-
-    @staticmethod
-    def sew_submessages_and_reactions_to_msgs(
-        messages: List[Dict[str, Any]]
-    ) -> List[Dict[str, Any]]:
-        msg_ids = [msg["id"] for msg in messages]
-        submessages = SubMessage.get_raw_db_rows(msg_ids)
-        sew_messages_and_submessages(messages, submessages)
-
-        reactions = Reaction.get_raw_db_rows(msg_ids)
-        return sew_messages_and_reactions(messages, reactions)
-
-    @staticmethod
-    def to_dict_uncached(
-        messages: Collection[Message], realm_id: Optional[int] = None
-    ) -> Dict[int, bytes]:
-        messages_dict = MessageDict.to_dict_uncached_helper(messages, realm_id)
-        encoded_messages = {msg["id"]: stringify_message_dict(msg) for msg in messages_dict}
-        return encoded_messages
-
-    @staticmethod
-    def to_dict_uncached_helper(
-        messages: Collection[Message], realm_id: Optional[int] = None
-    ) -> List[Dict[str, Any]]:
-        # Near duplicate of the build_message_dict + get_raw_db_rows
-        # code path that accepts already fetched Message objects
-        # rather than message IDs.
-
-        def get_rendering_realm_id(message: Message) -> int:
-            # realm_id can differ among users, currently only possible
-            # with cross realm bots.
-            if realm_id is not None:
-                return realm_id
-            if message.recipient.type == Recipient.STREAM:
-                return Stream.objects.get(id=message.recipient.type_id).realm_id
-            return message.realm_id
-
-        message_rows = [
-            {
-                "id": message.id,
-                DB_TOPIC_NAME: message.topic_name(),
-                "date_sent": message.date_sent,
-                "last_edit_time": message.last_edit_time,
-                "edit_history": message.edit_history,
-                "content": message.content,
-                "rendered_content": message.rendered_content,
-                "rendered_content_version": message.rendered_content_version,
-                "recipient_id": message.recipient.id,
-                "recipient__type": message.recipient.type,
-                "recipient__type_id": message.recipient.type_id,
-                "rendering_realm_id": get_rendering_realm_id(message),
-                "sender_id": message.sender.id,
-                "sending_client__name": message.sending_client.name,
-                "sender__realm_id": message.sender.realm_id,
-            }
-            for message in messages
-        ]
-
-        MessageDict.sew_submessages_and_reactions_to_msgs(message_rows)
-        return [MessageDict.build_dict_from_raw_db_row(row) for row in message_rows]
-
-    @staticmethod
-    def get_raw_db_rows(needed_ids: List[int]) -> List[Dict[str, Any]]:
-        # This is a special purpose function optimized for
-        # callers like get_messages_backend().
-        fields = [
-            "id",
-            DB_TOPIC_NAME,
-            "date_sent",
-            "last_edit_time",
-            "edit_history",
-            "content",
-            "rendered_content",
-            "rendered_content_version",
-            "recipient_id",
-            "recipient__type",
-            "recipient__type_id",
-            "sender_id",
-            "sending_client__name",
-            "sender__realm_id",
-        ]
-        # Uses index: zerver_message_pkey
-        messages = Message.objects.filter(id__in=needed_ids).values(*fields)
-        return MessageDict.sew_submessages_and_reactions_to_msgs(messages)
-
-    @staticmethod
-    def build_dict_from_raw_db_row(row: Dict[str, Any]) -> Dict[str, Any]:
-        """
-        row is a row from a .values() call, and it needs to have
-        all the relevant fields populated
-        """
-        return MessageDict.build_message_dict(
-            message_id=row["id"],
-            last_edit_time=row["last_edit_time"],
-            edit_history_json=row["edit_history"],
-            content=row["content"],
-            topic_name=row[DB_TOPIC_NAME],
-            date_sent=row["date_sent"],
-            rendered_content=row["rendered_content"],
-            rendered_content_version=row["rendered_content_version"],
-            sender_id=row["sender_id"],
-            sender_realm_id=row["sender__realm_id"],
-            sending_client_name=row["sending_client__name"],
-            rendering_realm_id=row.get("rendering_realm_id", row["sender__realm_id"]),
-            recipient_id=row["recipient_id"],
-            recipient_type=row["recipient__type"],
-            recipient_type_id=row["recipient__type_id"],
-            reactions=row["reactions"],
-            submessages=row["submessages"],
-        )
-
-    @staticmethod
-    def build_message_dict(
-        message_id: int,
-        last_edit_time: Optional[datetime],
-        edit_history_json: Optional[str],
-        content: str,
-        topic_name: str,
-        date_sent: datetime,
-        rendered_content: Optional[str],
-        rendered_content_version: Optional[int],
-        sender_id: int,
-        sender_realm_id: int,
-        sending_client_name: str,
-        rendering_realm_id: int,
-        recipient_id: int,
-        recipient_type: int,
-        recipient_type_id: int,
-        reactions: List[RawReactionRow],
-        submessages: List[Dict[str, Any]],
-    ) -> Dict[str, Any]:
-        obj = dict(
-            id=message_id,
-            sender_id=sender_id,
-            content=content,
-            recipient_type_id=recipient_type_id,
-            recipient_type=recipient_type,
-            recipient_id=recipient_id,
-            timestamp=datetime_to_timestamp(date_sent),
-            client=sending_client_name,
-        )
-
-        obj[TOPIC_NAME] = topic_name
-        obj["sender_realm_id"] = sender_realm_id
-
-        # Render topic_links with the stream's realm instead of the
-        # sender's realm; this is important for messages sent by
-        # cross-realm bots like NOTIFICATION_BOT.
-        obj[TOPIC_LINKS] = topic_links(rendering_realm_id, topic_name)
-
-        if last_edit_time is not None:
-            obj["last_edit_timestamp"] = datetime_to_timestamp(last_edit_time)
-            assert edit_history_json is not None
-            edit_history: List[EditHistoryEvent] = orjson.loads(edit_history_json)
-            obj["edit_history"] = edit_history
-
-        if Message.need_to_render_content(
-            rendered_content, rendered_content_version, markdown_version
-        ):
-            # We really shouldn't be rendering objects in this method, but there is
-            # a scenario where we upgrade the version of Markdown and fail to run
-            # management commands to re-render historical messages, and then we
-            # need to have side effects.  This method is optimized to not need full
-            # blown ORM objects, but the Markdown renderer is unfortunately highly
-            # coupled to Message, and we also need to persist the new rendered content.
-            # If we don't have a message object passed in, we get one here.  The cost
-            # of going to the DB here should be overshadowed by the cost of rendering
-            # and updating the row.
-            # TODO: see #1379 to eliminate Markdown dependencies
-            message = Message.objects.select_related("sender").get(id=message_id)
-
-            assert message is not None  # Hint for mypy.
-            # It's unfortunate that we need to have side effects on the message
-            # in some cases.
-            rendered_content = save_message_rendered_content(message, content)
-
-        if rendered_content is not None:
-            obj["rendered_content"] = rendered_content
-        else:
-            obj["rendered_content"] = (
-                "<p>[Zulip note: Sorry, we could not understand the formatting of your message]</p>"
-            )
-
-        if rendered_content is not None:
-            obj["is_me_message"] = Message.is_status_message(content, rendered_content)
-        else:
-            obj["is_me_message"] = False
-
-        obj["reactions"] = [
-            ReactionDict.build_dict_from_raw_db_row(reaction) for reaction in reactions
-        ]
-        obj["submessages"] = submessages
-        return obj
-
-    @staticmethod
-    def bulk_hydrate_sender_info(objs: List[Dict[str, Any]]) -> None:
-        sender_ids = list({obj["sender_id"] for obj in objs})
-
-        if not sender_ids:
-            return
-
-        query = UserProfile.objects.values(
-            "id",
-            "full_name",
-            "delivery_email",
-            "email",
-            "realm__string_id",
-            "avatar_source",
-            "avatar_version",
-            "is_mirror_dummy",
-            "email_address_visibility",
-        )
-
-        rows = query_for_ids(query, sender_ids, "zerver_userprofile.id")
-
-        sender_dict = {row["id"]: row for row in rows}
-
-        for obj in objs:
-            sender_id = obj["sender_id"]
-            user_row = sender_dict[sender_id]
-            obj["sender_full_name"] = user_row["full_name"]
-            obj["sender_email"] = user_row["email"]
-            obj["sender_delivery_email"] = user_row["delivery_email"]
-            obj["sender_realm_str"] = user_row["realm__string_id"]
-            obj["sender_avatar_source"] = user_row["avatar_source"]
-            obj["sender_avatar_version"] = user_row["avatar_version"]
-            obj["sender_is_mirror_dummy"] = user_row["is_mirror_dummy"]
-            obj["sender_email_address_visibility"] = user_row["email_address_visibility"]
-
-    @staticmethod
-    def hydrate_recipient_info(obj: Dict[str, Any], display_recipient: DisplayRecipientT) -> None:
-        """
-        This method hyrdrates recipient info with things
-        like full names and emails of senders.  Eventually
-        our clients should be able to hyrdrate these fields
-        themselves with info they already have on users.
-        """
-
-        recipient_type = obj["recipient_type"]
-        recipient_type_id = obj["recipient_type_id"]
-        sender_is_mirror_dummy = obj["sender_is_mirror_dummy"]
-        sender_email = obj["sender_email"]
-        sender_full_name = obj["sender_full_name"]
-        sender_id = obj["sender_id"]
-
-        if recipient_type == Recipient.STREAM:
-            display_type = "stream"
-        elif recipient_type in (Recipient.HUDDLE, Recipient.PERSONAL):
-            assert not isinstance(display_recipient, str)
-            display_type = "private"
-            if len(display_recipient) == 1:
-                # add the sender in if this isn't a message between
-                # someone and themself, preserving ordering
-                recip: UserDisplayRecipient = {
-                    "email": sender_email,
-                    "full_name": sender_full_name,
-                    "id": sender_id,
-                    "is_mirror_dummy": sender_is_mirror_dummy,
-                }
-                if recip["email"] < display_recipient[0]["email"]:
-                    display_recipient = [recip, display_recipient[0]]
-                elif recip["email"] > display_recipient[0]["email"]:
-                    display_recipient = [display_recipient[0], recip]
-        else:
-            raise AssertionError(f"Invalid recipient type {recipient_type}")
-
-        obj["display_recipient"] = display_recipient
-        obj["type"] = display_type
-        if obj["type"] == "stream":
-            obj["stream_id"] = recipient_type_id
-
-    @staticmethod
-    def bulk_hydrate_recipient_info(objs: List[Dict[str, Any]]) -> None:
-        recipient_tuples = {  # We use set to eliminate duplicate tuples.
-            (
-                obj["recipient_id"],
-                obj["recipient_type"],
-                obj["recipient_type_id"],
-            )
-            for obj in objs
-        }
-        display_recipients = bulk_fetch_display_recipients(recipient_tuples)
-
-        for obj in objs:
-            MessageDict.hydrate_recipient_info(obj, display_recipients[obj["recipient_id"]])
-
-    @staticmethod
-    def set_sender_avatar(
-        obj: Dict[str, Any], client_gravatar: bool, can_access_sender: bool = True
-    ) -> None:
-        if not can_access_sender:
-            obj["avatar_url"] = get_avatar_for_inaccessible_user()
-            return
-
-        sender_id = obj["sender_id"]
-        sender_realm_id = obj["sender_realm_id"]
-        sender_delivery_email = obj["sender_delivery_email"]
-        sender_avatar_source = obj["sender_avatar_source"]
-        sender_avatar_version = obj["sender_avatar_version"]
-
-        obj["avatar_url"] = get_avatar_field(
-            user_id=sender_id,
-            realm_id=sender_realm_id,
-            email=sender_delivery_email,
-            avatar_source=sender_avatar_source,
-            avatar_version=sender_avatar_version,
-            medium=False,
-            client_gravatar=client_gravatar,
-        )
-
-
-class ReactionDict:
-    @staticmethod
-    def build_dict_from_raw_db_row(row: RawReactionRow) -> Dict[str, Any]:
-        return {
-            "emoji_name": row["emoji_name"],
-            "emoji_code": row["emoji_code"],
-            "reaction_type": row["reaction_type"],
-            # TODO: We plan to remove this redundant user dictionary once
-            # clients are updated to support accessing use user_id.  See
-            # https://github.com/zulip/zulip/pull/14711 for details.
-            #
-            # When we do that, we can likely update the `.values()` query to
-            # not fetch the extra user_profile__* fields from the database
-            # as a small performance optimization.
-            "user": {
-                "email": row["user_profile__email"],
-                "id": row["user_profile_id"],
-                "full_name": row["user_profile__full_name"],
-            },
-            "user_id": row["user_profile_id"],
-        }
-
-
 def access_message(
    user_profile: UserProfile,
    message_id: int,
@ -1789,23 +1233,6 @@ def parse_message_time_limit_setting(
    return value


-def update_to_dict_cache(
-    changed_messages: Collection[Message], realm_id: Optional[int] = None
-) -> List[int]:
-    """Updates the message as stored in the to_dict cache (for serving
-    messages)."""
-    items_for_remote_cache = {}
-    message_ids = []
-    changed_messages_to_dict = MessageDict.to_dict_uncached(changed_messages, realm_id)
-    for msg_id, msg in changed_messages_to_dict.items():
-        message_ids.append(msg_id)
-        key = to_dict_cache_key_id(msg_id)
-        items_for_remote_cache[key] = (msg,)
-
-    cache_set_many(items_for_remote_cache)
-    return message_ids
-
-
 def visibility_policy_for_participation(
    sender: UserProfile,
    is_stream_muted: Optional[bool],
--- a/zerver/lib/message_cache.py
+++ b/zerver/lib/message_cache.py
@ -0,0 +1,570 @@
+import copy
+import zlib
+from datetime import datetime
+from email.headerregistry import Address
+from typing import Any, Collection, Dict, List, Optional, TypedDict
+
+import orjson
+
+from zerver.lib.avatar import get_avatar_field, get_avatar_for_inaccessible_user
+from zerver.lib.cache import cache_set_many, cache_with_key, to_dict_cache_key, to_dict_cache_key_id
+from zerver.lib.display_recipient import bulk_fetch_display_recipients
+from zerver.lib.markdown import render_message_markdown, topic_links
+from zerver.lib.markdown import version as markdown_version
+from zerver.lib.query_helpers import query_for_ids
+from zerver.lib.timestamp import datetime_to_timestamp
+from zerver.lib.topic import DB_TOPIC_NAME, TOPIC_LINKS, TOPIC_NAME
+from zerver.lib.types import DisplayRecipientT, EditHistoryEvent, UserDisplayRecipient
+from zerver.models import Message, Reaction, Realm, Recipient, Stream, SubMessage, UserProfile
+from zerver.models.realms import get_fake_email_domain
+
+
+class RawReactionRow(TypedDict):
+    emoji_code: str
+    emoji_name: str
+    message_id: int
+    reaction_type: str
+    user_profile__email: str
+    user_profile__full_name: str
+    user_profile_id: int
+
+
+def sew_messages_and_reactions(
+    messages: List[Dict[str, Any]], reactions: List[Dict[str, Any]]
+) -> List[Dict[str, Any]]:
+    """Given a iterable of messages and reactions stitch reactions
+    into messages.
+    """
+    # Add all messages with empty reaction item
+    for message in messages:
+        message["reactions"] = []
+
+    # Convert list of messages into dictionary to make reaction stitching easy
+    converted_messages = {message["id"]: message for message in messages}
+
+    for reaction in reactions:
+        converted_messages[reaction["message_id"]]["reactions"].append(reaction)
+
+    return list(converted_messages.values())
+
+
+def sew_messages_and_submessages(
+    messages: List[Dict[str, Any]], submessages: List[Dict[str, Any]]
+) -> None:
+    # This is super similar to sew_messages_and_reactions.
+    for message in messages:
+        message["submessages"] = []
+
+    message_dict = {message["id"]: message for message in messages}
+
+    for submessage in submessages:
+        message_id = submessage["message_id"]
+        if message_id in message_dict:
+            message = message_dict[message_id]
+            message["submessages"].append(submessage)
+
+
+def extract_message_dict(message_bytes: bytes) -> Dict[str, Any]:
+    return orjson.loads(zlib.decompress(message_bytes))
+
+
+def stringify_message_dict(message_dict: Dict[str, Any]) -> bytes:
+    return zlib.compress(orjson.dumps(message_dict))
+
+
+@cache_with_key(to_dict_cache_key, timeout=3600 * 24)
+def message_to_dict_json(message: Message, realm_id: Optional[int] = None) -> bytes:
+    return MessageDict.to_dict_uncached([message], realm_id)[message.id]
+
+
+def update_to_dict_cache(
+    changed_messages: Collection[Message], realm_id: Optional[int] = None
+) -> List[int]:
+    """Updates the message as stored in the to_dict cache (for serving
+    messages)."""
+    items_for_remote_cache = {}
+    message_ids = []
+    changed_messages_to_dict = MessageDict.to_dict_uncached(changed_messages, realm_id)
+    for msg_id, msg in changed_messages_to_dict.items():
+        message_ids.append(msg_id)
+        key = to_dict_cache_key_id(msg_id)
+        items_for_remote_cache[key] = (msg,)
+
+    cache_set_many(items_for_remote_cache)
+    return message_ids
+
+
+def save_message_rendered_content(message: Message, content: str) -> str:
+    rendering_result = render_message_markdown(message, content, realm=message.get_realm())
+    rendered_content = None
+    if rendering_result is not None:
+        rendered_content = rendering_result.rendered_content
+    message.rendered_content = rendered_content
+    message.rendered_content_version = markdown_version
+    message.save_rendered_content()
+    return rendered_content
+
+
+class ReactionDict:
+    @staticmethod
+    def build_dict_from_raw_db_row(row: RawReactionRow) -> Dict[str, Any]:
+        return {
+            "emoji_name": row["emoji_name"],
+            "emoji_code": row["emoji_code"],
+            "reaction_type": row["reaction_type"],
+            # TODO: We plan to remove this redundant user dictionary once
+            # clients are updated to support accessing use user_id.  See
+            # https://github.com/zulip/zulip/pull/14711 for details.
+            #
+            # When we do that, we can likely update the `.values()` query to
+            # not fetch the extra user_profile__* fields from the database
+            # as a small performance optimization.
+            "user": {
+                "email": row["user_profile__email"],
+                "id": row["user_profile_id"],
+                "full_name": row["user_profile__full_name"],
+            },
+            "user_id": row["user_profile_id"],
+        }
+
+
+class MessageDict:
+    """MessageDict is the core class responsible for marshalling Message
+    objects obtained from the database into a format that can be sent
+    to clients via the Zulip API, whether via `GET /messages`,
+    outgoing webhooks, or other code paths.  There are two core flows through
+    which this class is used:
+
+    * For just-sent messages, we construct a single `wide_dict` object
+      containing all the data for the message and the related
+      UserProfile models (sender_info and recipient_info); this object
+      can be stored in queues, caches, etc., and then later turned
+      into an API-format JSONable dictionary via finalize_payload.
+
+    * When fetching messages from the database, we fetch their data in
+      bulk using messages_for_ids, which makes use of caching, bulk
+      fetches that skip the Django ORM, etc., to provide an optimized
+      interface for fetching hundreds of thousands of messages from
+      the database and then turning them into API-format JSON
+      dictionaries.
+
+    """
+
+    @staticmethod
+    def wide_dict(message: Message, realm_id: Optional[int] = None) -> Dict[str, Any]:
+        """
+        The next two lines get the cacheable field related
+        to our message object, with the side effect of
+        populating the cache.
+        """
+        json = message_to_dict_json(message, realm_id)
+        obj = extract_message_dict(json)
+
+        """
+        The steps below are similar to what we do in
+        post_process_dicts(), except we don't call finalize_payload(),
+        since that step happens later in the queue
+        processor.
+        """
+        MessageDict.bulk_hydrate_sender_info([obj])
+        MessageDict.bulk_hydrate_recipient_info([obj])
+
+        return obj
+
+    @staticmethod
+    def post_process_dicts(
+        objs: List[Dict[str, Any]],
+        apply_markdown: bool,
+        client_gravatar: bool,
+        realm: Realm,
+    ) -> None:
+        """
+        NOTE: This function mutates the objects in
+              the `objs` list, rather than making
+              shallow copies.  It might be safer to
+              make shallow copies here, but performance
+              is somewhat important here, as we are
+              often fetching hundreds of messages.
+        """
+        MessageDict.bulk_hydrate_sender_info(objs)
+        MessageDict.bulk_hydrate_recipient_info(objs)
+
+        for obj in objs:
+            can_access_sender = obj.get("can_access_sender", True)
+            MessageDict.finalize_payload(
+                obj,
+                apply_markdown,
+                client_gravatar,
+                skip_copy=True,
+                can_access_sender=can_access_sender,
+                realm_host=realm.host,
+            )
+
+    @staticmethod
+    def finalize_payload(
+        obj: Dict[str, Any],
+        apply_markdown: bool,
+        client_gravatar: bool,
+        keep_rendered_content: bool = False,
+        skip_copy: bool = False,
+        can_access_sender: bool = True,
+        realm_host: str = "",
+    ) -> Dict[str, Any]:
+        """
+        By default, we make a shallow copy of the incoming dict to avoid
+        mutation-related bugs.  Code paths that are passing a unique object
+        can pass skip_copy=True to avoid this extra work.
+        """
+        if not skip_copy:
+            obj = copy.copy(obj)
+
+        if obj["sender_email_address_visibility"] != UserProfile.EMAIL_ADDRESS_VISIBILITY_EVERYONE:
+            # If email address of the sender is only available to administrators,
+            # clients cannot compute gravatars, so we force-set it to false.
+            # If we plumbed the current user's role, we could allow client_gravatar=True
+            # here if the current user's role has access to the target user's email address.
+            client_gravatar = False
+
+        if not can_access_sender:
+            # Enforce inability to access details of inaccessible
+            # users. We should be able to remove the realm_host and
+            # can_access_user plumbing to this function if/when we
+            # shift the Zulip API to not send these denormalized
+            # fields about message senders favor of just sending the
+            # sender's user ID.
+            obj["sender_full_name"] = str(UserProfile.INACCESSIBLE_USER_NAME)
+            sender_id = obj["sender_id"]
+            obj["sender_email"] = Address(
+                username=f"user{sender_id}", domain=get_fake_email_domain(realm_host)
+            ).addr_spec
+
+        MessageDict.set_sender_avatar(obj, client_gravatar, can_access_sender)
+        if apply_markdown:
+            obj["content_type"] = "text/html"
+            obj["content"] = obj["rendered_content"]
+        else:
+            obj["content_type"] = "text/x-markdown"
+
+        if not keep_rendered_content:
+            del obj["rendered_content"]
+        del obj["sender_realm_id"]
+        del obj["sender_avatar_source"]
+        del obj["sender_delivery_email"]
+        del obj["sender_avatar_version"]
+
+        del obj["recipient_type"]
+        del obj["recipient_type_id"]
+        del obj["sender_is_mirror_dummy"]
+        del obj["sender_email_address_visibility"]
+        if "can_access_sender" in obj:
+            del obj["can_access_sender"]
+        return obj
+
+    @staticmethod
+    def sew_submessages_and_reactions_to_msgs(
+        messages: List[Dict[str, Any]]
+    ) -> List[Dict[str, Any]]:
+        msg_ids = [msg["id"] for msg in messages]
+        submessages = SubMessage.get_raw_db_rows(msg_ids)
+        sew_messages_and_submessages(messages, submessages)
+
+        reactions = Reaction.get_raw_db_rows(msg_ids)
+        return sew_messages_and_reactions(messages, reactions)
+
+    @staticmethod
+    def to_dict_uncached(
+        messages: Collection[Message], realm_id: Optional[int] = None
+    ) -> Dict[int, bytes]:
+        messages_dict = MessageDict.to_dict_uncached_helper(messages, realm_id)
+        encoded_messages = {msg["id"]: stringify_message_dict(msg) for msg in messages_dict}
+        return encoded_messages
+
+    @staticmethod
+    def to_dict_uncached_helper(
+        messages: Collection[Message], realm_id: Optional[int] = None
+    ) -> List[Dict[str, Any]]:
+        # Near duplicate of the build_message_dict + get_raw_db_rows
+        # code path that accepts already fetched Message objects
+        # rather than message IDs.
+
+        def get_rendering_realm_id(message: Message) -> int:
+            # realm_id can differ among users, currently only possible
+            # with cross realm bots.
+            if realm_id is not None:
+                return realm_id
+            if message.recipient.type == Recipient.STREAM:
+                return Stream.objects.get(id=message.recipient.type_id).realm_id
+            return message.realm_id
+
+        message_rows = [
+            {
+                "id": message.id,
+                DB_TOPIC_NAME: message.topic_name(),
+                "date_sent": message.date_sent,
+                "last_edit_time": message.last_edit_time,
+                "edit_history": message.edit_history,
+                "content": message.content,
+                "rendered_content": message.rendered_content,
+                "rendered_content_version": message.rendered_content_version,
+                "recipient_id": message.recipient.id,
+                "recipient__type": message.recipient.type,
+                "recipient__type_id": message.recipient.type_id,
+                "rendering_realm_id": get_rendering_realm_id(message),
+                "sender_id": message.sender.id,
+                "sending_client__name": message.sending_client.name,
+                "sender__realm_id": message.sender.realm_id,
+            }
+            for message in messages
+        ]
+
+        MessageDict.sew_submessages_and_reactions_to_msgs(message_rows)
+        return [MessageDict.build_dict_from_raw_db_row(row) for row in message_rows]
+
+    @staticmethod
+    def get_raw_db_rows(needed_ids: List[int]) -> List[Dict[str, Any]]:
+        # This is a special purpose function optimized for
+        # callers like get_messages_backend().
+        fields = [
+            "id",
+            DB_TOPIC_NAME,
+            "date_sent",
+            "last_edit_time",
+            "edit_history",
+            "content",
+            "rendered_content",
+            "rendered_content_version",
+            "recipient_id",
+            "recipient__type",
+            "recipient__type_id",
+            "sender_id",
+            "sending_client__name",
+            "sender__realm_id",
+        ]
+        # Uses index: zerver_message_pkey
+        messages = Message.objects.filter(id__in=needed_ids).values(*fields)
+        return MessageDict.sew_submessages_and_reactions_to_msgs(messages)
+
+    @staticmethod
+    def build_dict_from_raw_db_row(row: Dict[str, Any]) -> Dict[str, Any]:
+        """
+        row is a row from a .values() call, and it needs to have
+        all the relevant fields populated
+        """
+        return MessageDict.build_message_dict(
+            message_id=row["id"],
+            last_edit_time=row["last_edit_time"],
+            edit_history_json=row["edit_history"],
+            content=row["content"],
+            topic_name=row[DB_TOPIC_NAME],
+            date_sent=row["date_sent"],
+            rendered_content=row["rendered_content"],
+            rendered_content_version=row["rendered_content_version"],
+            sender_id=row["sender_id"],
+            sender_realm_id=row["sender__realm_id"],
+            sending_client_name=row["sending_client__name"],
+            rendering_realm_id=row.get("rendering_realm_id", row["sender__realm_id"]),
+            recipient_id=row["recipient_id"],
+            recipient_type=row["recipient__type"],
+            recipient_type_id=row["recipient__type_id"],
+            reactions=row["reactions"],
+            submessages=row["submessages"],
+        )
+
+    @staticmethod
+    def build_message_dict(
+        message_id: int,
+        last_edit_time: Optional[datetime],
+        edit_history_json: Optional[str],
+        content: str,
+        topic_name: str,
+        date_sent: datetime,
+        rendered_content: Optional[str],
+        rendered_content_version: Optional[int],
+        sender_id: int,
+        sender_realm_id: int,
+        sending_client_name: str,
+        rendering_realm_id: int,
+        recipient_id: int,
+        recipient_type: int,
+        recipient_type_id: int,
+        reactions: List[RawReactionRow],
+        submessages: List[Dict[str, Any]],
+    ) -> Dict[str, Any]:
+        obj = dict(
+            id=message_id,
+            sender_id=sender_id,
+            content=content,
+            recipient_type_id=recipient_type_id,
+            recipient_type=recipient_type,
+            recipient_id=recipient_id,
+            timestamp=datetime_to_timestamp(date_sent),
+            client=sending_client_name,
+        )
+
+        obj[TOPIC_NAME] = topic_name
+        obj["sender_realm_id"] = sender_realm_id
+
+        # Render topic_links with the stream's realm instead of the
+        # sender's realm; this is important for messages sent by
+        # cross-realm bots like NOTIFICATION_BOT.
+        obj[TOPIC_LINKS] = topic_links(rendering_realm_id, topic_name)
+
+        if last_edit_time is not None:
+            obj["last_edit_timestamp"] = datetime_to_timestamp(last_edit_time)
+            assert edit_history_json is not None
+            edit_history: List[EditHistoryEvent] = orjson.loads(edit_history_json)
+            obj["edit_history"] = edit_history
+
+        if Message.need_to_render_content(
+            rendered_content, rendered_content_version, markdown_version
+        ):
+            # We really shouldn't be rendering objects in this method, but there is
+            # a scenario where we upgrade the version of Markdown and fail to run
+            # management commands to re-render historical messages, and then we
+            # need to have side effects.  This method is optimized to not need full
+            # blown ORM objects, but the Markdown renderer is unfortunately highly
+            # coupled to Message, and we also need to persist the new rendered content.
+            # If we don't have a message object passed in, we get one here.  The cost
+            # of going to the DB here should be overshadowed by the cost of rendering
+            # and updating the row.
+            # TODO: see #1379 to eliminate Markdown dependencies
+            message = Message.objects.select_related("sender").get(id=message_id)
+
+            assert message is not None  # Hint for mypy.
+            # It's unfortunate that we need to have side effects on the message
+            # in some cases.
+            rendered_content = save_message_rendered_content(message, content)
+
+        if rendered_content is not None:
+            obj["rendered_content"] = rendered_content
+        else:
+            obj["rendered_content"] = (
+                "<p>[Zulip note: Sorry, we could not understand the formatting of your message]</p>"
+            )
+
+        if rendered_content is not None:
+            obj["is_me_message"] = Message.is_status_message(content, rendered_content)
+        else:
+            obj["is_me_message"] = False
+
+        obj["reactions"] = [
+            ReactionDict.build_dict_from_raw_db_row(reaction) for reaction in reactions
+        ]
+        obj["submessages"] = submessages
+        return obj
+
+    @staticmethod
+    def bulk_hydrate_sender_info(objs: List[Dict[str, Any]]) -> None:
+        sender_ids = list({obj["sender_id"] for obj in objs})
+
+        if not sender_ids:
+            return
+
+        query = UserProfile.objects.values(
+            "id",
+            "full_name",
+            "delivery_email",
+            "email",
+            "realm__string_id",
+            "avatar_source",
+            "avatar_version",
+            "is_mirror_dummy",
+            "email_address_visibility",
+        )
+
+        rows = query_for_ids(query, sender_ids, "zerver_userprofile.id")
+
+        sender_dict = {row["id"]: row for row in rows}
+
+        for obj in objs:
+            sender_id = obj["sender_id"]
+            user_row = sender_dict[sender_id]
+            obj["sender_full_name"] = user_row["full_name"]
+            obj["sender_email"] = user_row["email"]
+            obj["sender_delivery_email"] = user_row["delivery_email"]
+            obj["sender_realm_str"] = user_row["realm__string_id"]
+            obj["sender_avatar_source"] = user_row["avatar_source"]
+            obj["sender_avatar_version"] = user_row["avatar_version"]
+            obj["sender_is_mirror_dummy"] = user_row["is_mirror_dummy"]
+            obj["sender_email_address_visibility"] = user_row["email_address_visibility"]
+
+    @staticmethod
+    def hydrate_recipient_info(obj: Dict[str, Any], display_recipient: DisplayRecipientT) -> None:
+        """
+        This method hyrdrates recipient info with things
+        like full names and emails of senders.  Eventually
+        our clients should be able to hyrdrate these fields
+        themselves with info they already have on users.
+        """
+
+        recipient_type = obj["recipient_type"]
+        recipient_type_id = obj["recipient_type_id"]
+        sender_is_mirror_dummy = obj["sender_is_mirror_dummy"]
+        sender_email = obj["sender_email"]
+        sender_full_name = obj["sender_full_name"]
+        sender_id = obj["sender_id"]
+
+        if recipient_type == Recipient.STREAM:
+            display_type = "stream"
+        elif recipient_type in (Recipient.HUDDLE, Recipient.PERSONAL):
+            assert not isinstance(display_recipient, str)
+            display_type = "private"
+            if len(display_recipient) == 1:
+                # add the sender in if this isn't a message between
+                # someone and themself, preserving ordering
+                recip: UserDisplayRecipient = {
+                    "email": sender_email,
+                    "full_name": sender_full_name,
+                    "id": sender_id,
+                    "is_mirror_dummy": sender_is_mirror_dummy,
+                }
+                if recip["email"] < display_recipient[0]["email"]:
+                    display_recipient = [recip, display_recipient[0]]
+                elif recip["email"] > display_recipient[0]["email"]:
+                    display_recipient = [display_recipient[0], recip]
+        else:
+            raise AssertionError(f"Invalid recipient type {recipient_type}")
+
+        obj["display_recipient"] = display_recipient
+        obj["type"] = display_type
+        if obj["type"] == "stream":
+            obj["stream_id"] = recipient_type_id
+
+    @staticmethod
+    def bulk_hydrate_recipient_info(objs: List[Dict[str, Any]]) -> None:
+        recipient_tuples = {  # We use set to eliminate duplicate tuples.
+            (
+                obj["recipient_id"],
+                obj["recipient_type"],
+                obj["recipient_type_id"],
+            )
+            for obj in objs
+        }
+        display_recipients = bulk_fetch_display_recipients(recipient_tuples)
+
+        for obj in objs:
+            MessageDict.hydrate_recipient_info(obj, display_recipients[obj["recipient_id"]])
+
+    @staticmethod
+    def set_sender_avatar(
+        obj: Dict[str, Any], client_gravatar: bool, can_access_sender: bool = True
+    ) -> None:
+        if not can_access_sender:
+            obj["avatar_url"] = get_avatar_for_inaccessible_user()
+            return
+
+        sender_id = obj["sender_id"]
+        sender_realm_id = obj["sender_realm_id"]
+        sender_delivery_email = obj["sender_delivery_email"]
+        sender_avatar_source = obj["sender_avatar_source"]
+        sender_avatar_version = obj["sender_avatar_version"]
+
+        obj["avatar_url"] = get_avatar_field(
+            user_id=sender_id,
+            realm_id=sender_realm_id,
+            email=sender_delivery_email,
+            avatar_source=sender_avatar_source,
+            avatar_version=sender_avatar_version,
+            medium=False,
+            client_gravatar=client_gravatar,
+        )
--- a/zerver/lib/outgoing_webhook.py
+++ b/zerver/lib/outgoing_webhook.py
@ -14,7 +14,7 @@ from typing_extensions import override
 from version import ZULIP_VERSION
 from zerver.actions.message_send import check_send_message
 from zerver.lib.exceptions import JsonableError, StreamDoesNotExistError
-from zerver.lib.message import MessageDict
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.outgoing_http import OutgoingSession
 from zerver.lib.queue import retry_event
 from zerver.lib.topic import get_topic_from_message_info
--- a/zerver/tests/test_message_dict.py
+++ b/zerver/tests/test_message_dict.py
@ -6,7 +6,8 @@ from django.utils.timezone import now as timezone_now
 from zerver.lib.cache import cache_delete, to_dict_cache_key_id
 from zerver.lib.display_recipient import get_display_recipient
 from zerver.lib.markdown import version as markdown_version
-from zerver.lib.message import MessageDict, messages_for_ids, sew_messages_and_reactions
+from zerver.lib.message import messages_for_ids
+from zerver.lib.message_cache import MessageDict, sew_messages_and_reactions
 from zerver.lib.per_request_cache import flush_per_request_caches
 from zerver.lib.test_classes import ZulipTestCase
 from zerver.lib.test_helpers import make_client
@ -207,7 +208,7 @@ class MessageDictTest(ZulipTestCase):
        self.assertEqual(message.rendered_content, expected_content)
        self.assertEqual(message.rendered_content_version, markdown_version)

-    @mock.patch("zerver.lib.message.render_message_markdown")
+    @mock.patch("zerver.lib.message_cache.render_message_markdown")
    def test_applying_markdown_invalid_format(self, convert_mock: Any) -> None:
        # pretend the converter returned an invalid message without raising an exception
        convert_mock.return_value = None
--- a/zerver/tests/test_message_edit.py
+++ b/zerver/tests/test_message_edit.py
@ -19,7 +19,8 @@ from zerver.actions.streams import do_change_stream_post_policy, do_deactivate_s
 from zerver.actions.user_groups import add_subgroups_to_user_group, check_add_user_group
 from zerver.actions.user_topics import do_set_user_topic_visibility_policy
 from zerver.actions.users import do_change_user_role
-from zerver.lib.message import MessageDict, has_message_access, messages_for_ids, truncate_topic
+from zerver.lib.message import has_message_access, messages_for_ids, truncate_topic
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.test_classes import ZulipTestCase, get_topic_messages
 from zerver.lib.test_helpers import queries_captured
 from zerver.lib.topic import RESOLVED_TOPIC_PREFIX, TOPIC_NAME
--- a/zerver/tests/test_message_fetch.py
+++ b/zerver/tests/test_message_fetch.py
@ -23,11 +23,11 @@ from zerver.lib.exceptions import JsonableError
 from zerver.lib.markdown import render_message_markdown
 from zerver.lib.mention import MentionBackend, MentionData
 from zerver.lib.message import (
-    MessageDict,
    get_first_visible_message_id,
    maybe_update_first_visible_message_id,
    update_first_visible_message_id,
 )
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.narrow import (
    LARGER_THAN_MAX_MESSAGE_ID,
    BadNarrowOperatorError,
--- a/zerver/tests/test_message_flags.py
+++ b/zerver/tests/test_message_flags.py
@ -11,7 +11,6 @@ from zerver.actions.user_topics import do_set_user_topic_visibility_policy
 from zerver.lib.fix_unreads import fix, fix_unsubscribed
 from zerver.lib.message import (
    MessageDetailsDict,
-    MessageDict,
    RawUnreadDirectMessageDict,
    RawUnreadMessagesResult,
    UnreadMessagesResult,
@ -23,6 +22,7 @@ from zerver.lib.message import (
    format_unread_message_details,
    get_raw_unread_data,
 )
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.test_classes import ZulipTestCase
 from zerver.lib.test_helpers import get_subscription, timeout_mock
 from zerver.lib.timeout import TimeoutExpiredError
--- a/zerver/tests/test_message_send.py
+++ b/zerver/tests/test_message_send.py
@ -33,7 +33,8 @@ from zerver.actions.user_settings import do_change_user_setting
 from zerver.actions.users import do_change_can_forge_sender, do_deactivate_user
 from zerver.lib.addressee import Addressee
 from zerver.lib.exceptions import JsonableError
-from zerver.lib.message import MessageDict, get_raw_unread_data, get_recent_private_conversations
+from zerver.lib.message import get_raw_unread_data, get_recent_private_conversations
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.per_request_cache import flush_per_request_caches
 from zerver.lib.streams import create_stream_if_needed
 from zerver.lib.test_classes import ZulipTestCase
--- a/zerver/tests/test_outgoing_webhook_interfaces.py
+++ b/zerver/tests/test_outgoing_webhook_interfaces.py
@ -7,7 +7,7 @@ from typing_extensions import override

 from zerver.lib.avatar import get_gravatar_url
 from zerver.lib.exceptions import JsonableError
-from zerver.lib.message import MessageDict
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.outgoing_webhook import get_service_interface_class, process_success_response
 from zerver.lib.test_classes import ZulipTestCase
 from zerver.lib.timestamp import datetime_to_timestamp
--- a/zerver/tests/test_reactions.py
+++ b/zerver/tests/test_reactions.py
@ -9,7 +9,7 @@ from zerver.actions.streams import do_change_stream_permission
 from zerver.lib.cache import cache_get, to_dict_cache_key_id
 from zerver.lib.emoji import get_emoji_data
 from zerver.lib.exceptions import JsonableError
-from zerver.lib.message import extract_message_dict
+from zerver.lib.message_cache import extract_message_dict
 from zerver.lib.test_classes import ZulipTestCase
 from zerver.lib.test_helpers import zulip_reaction_info
 from zerver.models import Message, Reaction, RealmEmoji, UserMessage
--- a/zerver/tests/test_submessage.py
+++ b/zerver/tests/test_submessage.py
@ -2,7 +2,7 @@ from typing import Any, Dict, List
 from unittest import mock

 from zerver.actions.submessage import do_add_submessage
-from zerver.lib.message import MessageDict
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.test_classes import ZulipTestCase
 from zerver.models import Message, SubMessage

--- a/zerver/tornado/event_queue.py
+++ b/zerver/tornado/event_queue.py
@ -39,7 +39,7 @@ from typing_extensions import override

 from version import API_FEATURE_LEVEL, ZULIP_MERGE_BASE, ZULIP_VERSION
 from zerver.lib.exceptions import JsonableError
-from zerver.lib.message import MessageDict
+from zerver.lib.message_cache import MessageDict
 from zerver.lib.narrow import build_narrow_predicate
 from zerver.lib.narrow_helpers import narrow_dataclasses_from_tuples
 from zerver.lib.notification_data import UserMessageNotificationsData