Fix subtitle font handling with in-memory fonts from SMPTE (#2509).
[dcpomatic.git] / src / lib / render_text.cc
1 /*
2     Copyright (C) 2014-2021 Carl Hetherington <cth@carlh.net>
3
4     This file is part of DCP-o-matic.
5
6     DCP-o-matic is free software; you can redistribute it and/or modify
7     it under the terms of the GNU General Public License as published by
8     the Free Software Foundation; either version 2 of the License, or
9     (at your option) any later version.
10
11     DCP-o-matic is distributed in the hope that it will be useful,
12     but WITHOUT ANY WARRANTY; without even the implied warranty of
13     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14     GNU General Public License for more details.
15
16     You should have received a copy of the GNU General Public License
17     along with DCP-o-matic.  If not, see <http://www.gnu.org/licenses/>.
18
19 */
20
21
22 #include "cross.h"
23 #include "dcpomatic_assert.h"
24 #include "font.h"
25 #include "font_config.h"
26 #include "image.h"
27 #include "render_text.h"
28 #include "util.h"
29 #include <dcp/raw_convert.h>
30 #include <dcp/warnings.h>
31 #include <cairomm/cairomm.h>
32 LIBDCP_DISABLE_WARNINGS
33 #include <pangomm.h>
34 LIBDCP_ENABLE_WARNINGS
35 #include <pango/pangocairo.h>
36 #include <boost/algorithm/string.hpp>
37 #include <iostream>
38
39
40 using std::cerr;
41 using std::cout;
42 using std::list;
43 using std::make_pair;
44 using std::make_shared;
45 using std::max;
46 using std::min;
47 using std::pair;
48 using std::shared_ptr;
49 using std::string;
50 using boost::optional;
51 using namespace dcpomatic;
52
53
54 /** Create a Pango layout using a dummy context which we can use to calculate the size
55  *  of the text we will render.  Then we can transfer the layout over to the real context
56  *  for the actual render.
57  */
58 static Glib::RefPtr<Pango::Layout>
59 create_layout(string font_name, string markup)
60 {
61         auto c_font_map = pango_cairo_font_map_new ();
62         DCPOMATIC_ASSERT (c_font_map);
63         auto font_map = Glib::wrap (c_font_map);
64         auto c_context = pango_font_map_create_context (c_font_map);
65         DCPOMATIC_ASSERT (c_context);
66         auto context = Glib::wrap (c_context);
67         auto layout = Pango::Layout::create(context);
68
69         layout->set_alignment (Pango::ALIGN_LEFT);
70         Pango::FontDescription font (font_name);
71         layout->set_font_description (font);
72         layout->set_markup (markup);
73
74         return layout;
75 }
76
77
78 string
79 marked_up (list<StringText> subtitles, int target_height, float fade_factor, string font_name)
80 {
81         auto constexpr pixels_to_1024ths_point = 72 * 1024 / 96;
82
83         auto make_span = [target_height, fade_factor](StringText const& subtitle, string text, string extra_attribute) {
84                 string span;
85                 span += "<span ";
86                 if (subtitle.italic()) {
87                         span += "style=\"italic\" ";
88                 }
89                 if (subtitle.bold()) {
90                         span += "weight=\"bold\" ";
91                 }
92                 if (subtitle.underline()) {
93                         span += "underline=\"single\" ";
94                 }
95                 span += "size=\"" + dcp::raw_convert<string>(lrintf(subtitle.size_in_pixels(target_height) * pixels_to_1024ths_point)) + "\" ";
96                 /* Between 1-65535 inclusive, apparently... */
97                 span += "alpha=\"" + dcp::raw_convert<string>(int(floor(fade_factor * 65534)) + 1) + "\" ";
98                 span += "color=\"#" + subtitle.colour().to_rgb_string() + "\"";
99                 if (!extra_attribute.empty()) {
100                         span += " " + extra_attribute;
101                 }
102                 span += ">";
103
104                 boost::algorithm::replace_all(text, "&", "&amp;");
105                 boost::algorithm::replace_all(text, "<", "&lt;");
106                 boost::algorithm::replace_all(text, ">", "&gt;");
107
108                 span += text;
109                 span += "</span>";
110                 return span;
111         };
112
113         string out;
114         for (auto const& i: subtitles) {
115                 if (std::abs(i.space_before()) > dcp::SPACE_BEFORE_EPSILON) {
116                         /* We need to insert some horizontal space into the layout.  The only way I can find to do this
117                          * is to write a " " with some special letter_spacing.  As far as I can see, such a space will
118                          * be written with letter_spacing either side.  This means that to get a horizontal space x we
119                          * need to write a " " with letter spacing (x - s) / 2, where s is the width of the " ".
120                          */
121                         auto layout = create_layout(font_name, make_span(i, " ", {}));
122                         int space_width;
123                         int dummy;
124                         layout->get_pixel_size(space_width, dummy);
125                         auto spacing = ((i.space_before() * i.size_in_pixels(target_height) - space_width) / 2) * pixels_to_1024ths_point;
126                         out += make_span(i, " ", "letter_spacing=\"" + dcp::raw_convert<string>(spacing) + "\"");
127                 }
128
129                 out += make_span(i, i.text(), {});
130         }
131
132         return out;
133 }
134
135
136 static void
137 set_source_rgba (Cairo::RefPtr<Cairo::Context> context, dcp::Colour colour, float fade_factor)
138 {
139         context->set_source_rgba (float(colour.r) / 255, float(colour.g) / 255, float(colour.b) / 255, fade_factor);
140 }
141
142
143 static shared_ptr<Image>
144 create_image (dcp::Size size)
145 {
146         /* FFmpeg BGRA means first byte blue, second byte green, third byte red, fourth byte alpha.
147          * This must be COMPACT as we're using it with Cairo::ImageSurface::create
148          */
149         auto image = make_shared<Image>(AV_PIX_FMT_BGRA, size, Image::Alignment::COMPACT);
150         image->make_black ();
151         return image;
152 }
153
154
155 static Cairo::RefPtr<Cairo::ImageSurface>
156 create_surface (shared_ptr<Image> image)
157 {
158         /* XXX: I don't think it's guaranteed that format_stride_for_width will return a stride without any padding,
159          * so it's lucky that this works.
160          */
161         DCPOMATIC_ASSERT (image->alignment() == Image::Alignment::COMPACT);
162         DCPOMATIC_ASSERT (image->pixel_format() == AV_PIX_FMT_BGRA);
163         return Cairo::ImageSurface::create (
164                 image->data()[0],
165                 Cairo::FORMAT_ARGB32,
166                 image->size().width,
167                 image->size().height,
168                 /* Cairo ARGB32 means first byte blue, second byte green, third byte red, fourth byte alpha */
169                 Cairo::ImageSurface::format_stride_for_width (Cairo::FORMAT_ARGB32, image->size().width)
170                 );
171 }
172
173
174 static float
175 calculate_fade_factor (StringText const& first, DCPTime time, int frame_rate)
176 {
177         float fade_factor = 1;
178
179         /* Round the fade start/end to the nearest frame start.  Otherwise if a subtitle starts just after
180            the start of a frame it will be faded out.
181         */
182         auto const fade_in_start = DCPTime::from_seconds(first.in().as_seconds()).round(frame_rate);
183         auto const fade_in_end = fade_in_start + DCPTime::from_seconds (first.fade_up_time().as_seconds ());
184
185         if (fade_in_start <= time && time <= fade_in_end && fade_in_start != fade_in_end) {
186                 fade_factor *= DCPTime(time - fade_in_start).seconds() / DCPTime(fade_in_end - fade_in_start).seconds();
187         }
188
189         if (time < fade_in_start) {
190                 fade_factor = 0;
191         }
192
193         /* first.out() may be zero if we don't know when this subtitle will finish.  We can only think about
194          * fading out if we _do_ know when it will finish.
195          */
196         if (first.out() != dcp::Time()) {
197                 auto const fade_out_end = DCPTime::from_seconds (first.out().as_seconds()).round(frame_rate);
198                 auto const fade_out_start = fade_out_end - DCPTime::from_seconds(first.fade_down_time().as_seconds());
199
200                 if (fade_out_start <= time && time <= fade_out_end && fade_out_start != fade_out_end) {
201                         fade_factor *= 1 - DCPTime(time - fade_out_start).seconds() / DCPTime(fade_out_end - fade_out_start).seconds();
202                 }
203                 if (time > fade_out_end) {
204                         fade_factor = 0;
205                 }
206         }
207
208         return fade_factor;
209 }
210
211
212 static int
213 x_position(dcp::HAlign align, float position, int target_width, int layout_width)
214 {
215         int x = 0;
216         switch (align) {
217         case dcp::HAlign::LEFT:
218                 /* h_position is distance between left of frame and left of subtitle */
219                 x = position * target_width;
220                 break;
221         case dcp::HAlign::CENTER:
222                 /* h_position is distance between centre of frame and centre of subtitle */
223                 x = (0.5 + position) * target_width - layout_width / 2;
224                 break;
225         case dcp::HAlign::RIGHT:
226                 /* h_position is distance between right of frame and right of subtitle */
227                 x = (1.0 - position) * target_width - layout_width;
228                 break;
229         }
230
231         return x;
232 }
233
234
235 /** @param align_standard Standard with which to interpret this subtitle's position.
236  *  @param align alignment.
237  *  @param position position (between 0 and 1)
238  *  @param target_height Height of the target screen (in pixels).
239  *  @param baseline_to_bottom Distance from text baseline to the bottom of the bounding box (in pixels).
240  *  @param layout_height Height of the subtitle bounding box (in pixels).
241  *  @return y position of the top of the subtitle bounding box (in pixels) from the top of the screen.
242  */
243 static int
244 y_position(dcp::SubtitleStandard standard, dcp::VAlign align, float position, int target_height, int baseline_to_bottom, int layout_height)
245 {
246         int y = 0;
247         switch (standard) {
248         case dcp::SubtitleStandard::INTEROP:
249         case dcp::SubtitleStandard::SMPTE_2014:
250                 switch (align) {
251                 case dcp::VAlign::TOP:
252                         /* position is distance from top of frame to subtitle baseline */
253                         y = position * target_height - (layout_height - baseline_to_bottom);
254                         break;
255                 case dcp::VAlign::CENTER:
256                         /* position is distance from centre of frame to subtitle baseline */
257                         y = (0.5 + position) * target_height - (layout_height - baseline_to_bottom);
258                         break;
259                 case dcp::VAlign::BOTTOM:
260                         /* position is distance from bottom of frame to subtitle baseline */
261                         y = (1.0 - position) * target_height - (layout_height - baseline_to_bottom);
262                         break;
263                 }
264                 break;
265         case dcp::SubtitleStandard::SMPTE_2007:
266         case dcp::SubtitleStandard::SMPTE_2010:
267                 switch (align) {
268                 case dcp::VAlign::TOP:
269                         /* v_position is distance from top of frame to top of subtitle */
270                         y = position * target_height;
271                         break;
272                 case dcp::VAlign::CENTER:
273                         /* v_position is distance from centre of frame to centre of subtitle */
274                         y = (0.5 + position) * target_height - layout_height / 2;
275                         break;
276                 case dcp::VAlign::BOTTOM:
277                         /* v_position is distance from bottom of frame to bottom of subtitle */
278                         y = (1.0 - position) * target_height - layout_height;
279                         break;
280                 }
281         }
282
283         return y;
284 }
285
286
287 struct Layout
288 {
289         Position<int> position;
290         dcp::Size size;
291         Glib::RefPtr<Pango::Layout> pango;
292 };
293
294
295 /** @param subtitles A list of subtitles that are all on the same line,
296  *  at the same time and with the same fade in/out.
297  */
298 static Layout
299 setup_layout(list<StringText> subtitles, dcp::Size target, DCPTime time, int frame_rate)
300 {
301         DCPOMATIC_ASSERT(!subtitles.empty());
302         auto const& first = subtitles.front();
303
304         auto const font_name = FontConfig::instance()->make_font_available(first.font);
305         auto const fade_factor = calculate_fade_factor(first, time, frame_rate);
306         auto const markup = marked_up(subtitles, target.height, fade_factor, font_name);
307         auto layout = create_layout(font_name, markup);
308         auto ink = layout->get_ink_extents();
309         return { { ink.get_x() / Pango::SCALE, ink.get_y() / Pango::SCALE }, { ink.get_width() / Pango::SCALE, ink.get_height() / Pango::SCALE }, layout };
310 }
311
312
313 /** @param subtitles A list of subtitles that are all on the same line,
314  *  at the same time and with the same fade in/out.
315  */
316 static PositionImage
317 render_line (list<StringText> subtitles, dcp::Size target, DCPTime time, int frame_rate)
318 {
319         /* XXX: this method can only handle italic / bold changes mid-line,
320            nothing else yet.
321         */
322
323         DCPOMATIC_ASSERT(!subtitles.empty ());
324         auto const& first = subtitles.front();
325         auto const fade_factor = calculate_fade_factor(first, time, frame_rate);
326
327         auto layout = setup_layout(subtitles, target, time, frame_rate);
328
329         /* Calculate x and y scale factors.  These are only used to stretch
330            the font away from its normal aspect ratio.
331         */
332         float x_scale = 1;
333         float y_scale = 1;
334         if (fabs (first.aspect_adjust() - 1.0) > dcp::ASPECT_ADJUST_EPSILON) {
335                 if (first.aspect_adjust() < 1) {
336                         x_scale = max (0.25f, first.aspect_adjust ());
337                         y_scale = 1;
338                 } else {
339                         x_scale = 1;
340                         y_scale = 1 / min (4.0f, first.aspect_adjust ());
341                 }
342         }
343
344         auto const border_width = first.effect() == dcp::Effect::BORDER ? (first.outline_width * target.width / 2048.0) : 0;
345         layout.size.width += 2 * ceil (border_width);
346         layout.size.height += 2 * ceil (border_width);
347
348         layout.size.width *= x_scale;
349         layout.size.height *= y_scale;
350
351         /* Shuffle the subtitle over by the border width (if we have any) so it's not cut off */
352         int const x_offset = -layout.position.x + ceil(border_width);
353         int const y_offset = -layout.position.y + ceil(border_width);
354
355         auto image = create_image(layout.size);
356         auto surface = create_surface (image);
357         auto context = Cairo::Context::create (surface);
358
359         context->set_line_width (1);
360         context->scale (x_scale, y_scale);
361         layout.pango->update_from_cairo_context(context);
362
363         if (first.effect() == dcp::Effect::SHADOW) {
364                 /* Drop-shadow effect */
365                 set_source_rgba (context, first.effect_colour(), fade_factor);
366                 context->move_to (x_offset + 4, y_offset + 4);
367                 layout.pango->add_to_cairo_context(context);
368                 context->fill ();
369         }
370
371         if (first.effect() == dcp::Effect::BORDER) {
372                 /* Border effect */
373                 set_source_rgba (context, first.effect_colour(), fade_factor);
374                 context->set_line_width (border_width);
375                 context->set_line_join (Cairo::LINE_JOIN_ROUND);
376                 context->move_to (x_offset, y_offset);
377                 layout.pango->add_to_cairo_context (context);
378                 context->stroke ();
379         }
380
381         /* The actual subtitle */
382
383         set_source_rgba (context, first.colour(), fade_factor);
384
385         context->move_to (x_offset, y_offset);
386         layout.pango->add_to_cairo_context (context);
387         context->fill ();
388
389         context->set_line_width (0.5);
390         context->move_to (x_offset, y_offset);
391         layout.pango->add_to_cairo_context (context);
392         context->stroke ();
393
394         int const x = x_position(first.h_align(), first.h_position(), target.width, layout.size.width);
395         int const y = y_position(first.valign_standard, first.v_align(), first.v_position(), target.height, layout.position.y, layout.size.height);
396         return PositionImage (image, Position<int>(max (0, x), max(0, y)));
397 }
398
399
400 /** @param time Time of the frame that these subtitles are going on.
401  *  @param target Size of the container that this subtitle will end up in.
402  *  @param frame_rate DCP frame rate.
403  */
404 list<PositionImage>
405 render_text (list<StringText> subtitles, dcp::Size target, DCPTime time, int frame_rate)
406 {
407         list<StringText> pending;
408         list<PositionImage> images;
409
410         for (auto const& i: subtitles) {
411                 if (!pending.empty() && (i.v_align() != pending.back().v_align() || fabs(i.v_position() - pending.back().v_position()) > 1e-4)) {
412                         images.push_back(render_line(pending, target, time, frame_rate));
413                         pending.clear ();
414                 }
415                 pending.push_back (i);
416         }
417
418         if (!pending.empty()) {
419                 images.push_back(render_line(pending, target, time, frame_rate));
420         }
421
422         return images;
423 }
424
425
426 list<dcpomatic::Rect<int>>
427 bounding_box(list<StringText> subtitles, dcp::Size target, optional<dcp::SubtitleStandard> override_standard)
428 {
429         list<StringText> pending;
430         list<dcpomatic::Rect<int>> rects;
431
432         auto use_pending = [&pending, &rects, target, override_standard]() {
433                 auto const& subtitle = pending.front();
434                 auto standard = override_standard.get_value_or(subtitle.valign_standard);
435                 /* We can provide dummy values for time and frame rate here as they are only used to calculate fades */
436                 auto layout = setup_layout(pending, target, DCPTime(), 24);
437                 int const x = x_position(subtitle.h_align(), subtitle.h_position(), target.width, layout.size.width);
438                 int const y = y_position(standard, subtitle.v_align(), subtitle.v_position(), target.height, layout.position.y, layout.size.height);
439                 rects.push_back({Position<int>(x, y), layout.size.width, layout.size.height});
440         };
441
442         for (auto const& i: subtitles) {
443                 if (!pending.empty() && (i.v_align() != pending.back().v_align() || fabs(i.v_position() - pending.back().v_position()) > 1e-4)) {
444                         use_pending();
445                         pending.clear();
446                 }
447                 pending.push_back(i);
448         }
449
450         if (!pending.empty()) {
451                 use_pending();
452         }
453
454         return rects;
455 }
456
457
458 float
459 FontMetrics::height(StringText const& subtitle)
460 {
461         return get(subtitle)->second.second;
462 }
463
464
465 float
466 FontMetrics::baseline_to_bottom(StringText const& subtitle)
467 {
468         return get(subtitle)->second.first;
469 }
470
471
472 FontMetrics::Cache::iterator
473 FontMetrics::get(StringText const& subtitle)
474 {
475         auto id = Identifier(subtitle);
476
477         auto iter = _cache.find(id);
478         if (iter != _cache.end()) {
479                 return iter;
480         }
481
482         auto const font_name = FontConfig::instance()->make_font_available(subtitle.font);
483         auto copy = subtitle;
484         copy.set_text("Qypjg");
485         auto layout = create_layout(font_name, marked_up({copy}, _target_height, 1, font_name));
486         auto ink = layout->get_ink_extents();
487         auto const scale = float(_target_height * Pango::SCALE);
488         return _cache.insert({id, { ink.get_y() / scale, ink.get_height() / scale}}).first;
489 }
490
491
492 FontMetrics::Identifier::Identifier(StringText const& subtitle)
493         : font(subtitle.font)
494         , size(subtitle.size())
495         , aspect_adjust(subtitle.aspect_adjust())
496 {
497
498 }
499
500
501 bool
502 FontMetrics::Identifier::operator<(FontMetrics::Identifier const& other) const
503 {
504         if (font != other.font) {
505                 return font < other.font;
506         }
507
508         if (size != other.size) {
509             return size < other.size;
510         }
511
512         return aspect_adjust < other.aspect_adjust;
513 }
514