From c6916faca2f3f04e7c4c3db8f4127f2f39ee2953 Mon Sep 17 00:00:00 2001
From: Tim Abbott <tabbott@humbughq.com>
Date: Thu, 27 Jun 2013 15:55:42 -0400
Subject: [PATCH] Genericize the bulk cache fetching logic.

(imported from commit 52664ce0ad800efff6b583e80c27701638ff6205)
---
 zephyr/lib/cache.py | 41 +++++++++++++++++++++++++++++++++++++++++
 zephyr/views.py     | 35 ++++++++++-------------------------
 2 files changed, 51 insertions(+), 25 deletions(-)

diff --git a/zephyr/lib/cache.py b/zephyr/lib/cache.py
index 3cbc753b9a..f7c757f0a9 100644
--- a/zephyr/lib/cache.py
+++ b/zephyr/lib/cache.py
@@ -141,6 +141,47 @@ def cache_set_many(items, cache_name=None, timeout=None):
     memcached_stats_finish()
     return ret
 
+# Required Arguments are as follows:
+# * object_ids: The list of object ids to look up
+# * cache_key_function: object_id => cache key
+# * query_function: [object_ids] => [objects from database]
+# Optional keyword arguments:
+# * setter: Function to call before storing items to cache (e.g. compression)
+# * extractor: Function to call on items returned from cache
+#   (e.g. decompression).  Should be the inverse of the setter
+#   function.
+# * id_fetcher: Function mapping an object from database => object_id
+#   (in case we're using a key more complex than obj.id)
+# * cache_transformer: Function mapping an object from database =>
+#   value for cache (in case the values that we're caching are some
+#   function of the objects, not the objects themselves)
+def generic_bulk_cached_fetch(cache_key_function, query_function, object_ids,
+                              extractor=lambda obj: obj,
+                              setter=lambda obj: obj,
+                              id_fetcher=lambda obj: obj.id,
+                              cache_transformer=lambda obj: obj):
+    cache_keys = {}
+    for object_id in object_ids:
+        cache_keys[object_id] = cache_key_function(object_id)
+    cached_objects = cache_get_many([cache_keys[object_id]
+                                     for object_id in object_ids])
+    for (key, val) in cached_objects.items():
+        cached_objects[key] = extractor(cached_objects[key][0])
+    needed_ids = [object_id for object_id in object_ids if
+                  cache_keys[object_id] not in cached_objects]
+    db_objects = query_function(needed_ids)
+
+    items_for_memcached = {}
+    for obj in db_objects:
+        key = cache_keys[id_fetcher(obj)]
+        item = cache_transformer(obj)
+        items_for_memcached[key] = (setter(item),)
+        cached_objects[key] = item
+    if len(items_for_memcached) > 0:
+        cache_set_many(items_for_memcached)
+    return dict((object_id, cached_objects[cache_keys[object_id]]) for object_id in object_ids
+                if cache_keys[object_id] in cached_objects)
+
 def cache(func):
     """Decorator which applies Django caching to a function.
 
diff --git a/zephyr/views.py b/zephyr/views.py
index d530af8192..e40454a64a 100644
--- a/zephyr/views.py
+++ b/zephyr/views.py
@@ -49,7 +49,8 @@ from zephyr.lib.query import last_n
 from zephyr.lib.avatar import avatar_url
 from zephyr.lib.upload import upload_message_image, upload_avatar_image
 from zephyr.lib.response import json_success, json_error, json_response, json_method_not_allowed
-from zephyr.lib.cache import cache_get_many, cache_set_many
+from zephyr.lib.cache import cache_get_many, cache_set_many, \
+    generic_bulk_cached_fetch
 from zephyr.lib.unminify import SourceMap
 from zephyr.lib.queue import queue_json_publish
 from zephyr.lib.utils import statsd
@@ -917,34 +918,18 @@ def get_old_messages_backend(request, user_profile,
                     dict([('match_subject', user_message.match_subject),
                           ('match_content', user_message.match_content)])
 
-    bulk_messages = cache_get_many([to_dict_cache_key_id(message_id, apply_markdown)
-                                    for message_id in message_ids])
-    for (key, val) in bulk_messages.items():
-        bulk_messages[key] = extract_message_dict(bulk_messages[key][0])
-
-    needed_ids = [message_id for message_id in message_ids if
-                  to_dict_cache_key_id(message_id, apply_markdown) not in bulk_messages]
-    if len(needed_ids) > 0:
-        full_messages = Message.objects.select_related().filter(id__in=needed_ids)
-
-        items_for_memcached = {}
-        for message in full_messages:
-            key = to_dict_cache_key(message, apply_markdown)
-            if bulk_messages.get(key) is None:
-                msg = message.to_dict_uncached(apply_markdown)
-                elt = stringify_message_dict(msg)
-                items_for_memcached[key] = (elt,)
-                bulk_messages[key] = msg
-        if len(items_for_memcached) > 0:
-            cache_set_many(items_for_memcached)
+    message_dicts = generic_bulk_cached_fetch(lambda message_id: to_dict_cache_key_id(message_id, apply_markdown),
+                                              lambda needed_ids: Message.objects.select_related().filter(id__in=needed_ids),
+                                              message_ids,
+                                              cache_transformer=lambda x: x.to_dict_uncached(apply_markdown),
+                                              extractor=extract_message_dict,
+                                              setter=stringify_message_dict)
 
     message_list = []
     for message_id in message_ids:
-        key = to_dict_cache_key_id(message_id, apply_markdown)
-        elt = bulk_messages.get(key)
-        msg_dict = dict(elt)
+        msg_dict = message_dicts[message_id]
         msg_dict.update({"flags": user_message_flags[message_id]})
-        msg_dict.update(search_fields.get(elt['id'], {}))
+        msg_dict.update(search_fields.get(message_id, {}))
         message_list.append(msg_dict)
 
     statsd.incr('loaded_old_messages', len(message_list))